java URLConnection 网页爬虫抓取http页面代码

代码语言:java

所属分类:文件

代码描述:java URLConnection 网页爬虫抓取http页面代码

代码标签: 爬虫 抓取 http 页面

下面为部分代码预览,完整代码请点击下载或在bfwstudio webide中打开

import java.io.BufferedReader;//导入java.io包下的BufferedReader类
import java.io.IOException;//导入java.io包下的IOException类
import java.io.InputStream;//导入java.io包下的InputStream类
import java.io.InputStreamReader;//导入java.io包下的InputStreamReader类
import java.net.MalformedURLException;//导入java.net包下的MalformedURLException类
import java.net.URL;//导入java.net包下的URL类
import java.net.URLConnection;//导入java.net包下的URLConnection类
public class HelloWorld {//类名
    public static void main(String[] args){//程序主函数
        new ReadByGet().start();//调用新建的ReadByGet类
        }
    static class ReadByGet extends Thread{//定义一个静态的ReadByGet类继承于Thread类
        public void run(){//run方法,里面包含需要执行的任务
            try{//try代码块,当发生异常时会转到catch代码块中
                URL url=new URL("http://www.bfw.wiki");//创建一个URL类的实例,并指定网址
                URLConnection connection=url.openConnection();//创建实例连接指定URL上的内容
                InputStream is=connection.getInputStream();//获取内容的字节流
                InputStreamReader isr=new InputStreamReader(is,"utf-8");//将字节流包装为字符串流,并制定编码格式为utf-8
                BufferedReader br=new BufferedReader(isr);//创建一个实例用来存放转换后的字符
                String line;//定义一个字符串类型变量
                StringBuilder.........完整代码请登录后点击上方下载按钮下载查看

网友评论0