本文實例講述了java在網(wǎng)頁上面抓取郵件地址的方法。分享給大家供大家參考。具體實現(xiàn)方法如下:
import java.io.InputStreamReader;
import java.net.URL;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class h1
{
public static String getWebCon(String domain)
{
System.out.println("開始抓取郵件地址..("+domain+")");
StringBuffer sb=new StringBuffer();
try
{
java.net.URL url=new java.net.URL(domain);
BufferedReader in=new BufferedReader(new InputStreamReader(url.openStream()));
String line;
while((line=in.readLine())!=null)
{
parse(line);
}
in.close();
}
catch(Exception e)
{
sb.append(e.toString());
System.err.println(e);
}
return sb.toString();
}
public static void main(String[] args)
{
String s;
s=h1.getWebCon("http://post.baidu.com/f?kz=34942387"); //這是要抓取的網(wǎng)頁,自己可以試下.
//System.out.println(s);
}
private static void parse(String line)
{
Pattern p=Pattern.compile("[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+");//郵箱的正則表達(dá)式
Matcher m=p.matcher(line);
while(m.find())
{
System.out.println(m.group());
}
}
}
希望本文所述對大家的Java程序設(shè)計有所幫助。