python爬取url网页中所有的链接地址代码
代码语言:python
所属分类:web系统
代码描述:python爬取url网页中所有的链接地址代码,并分内部链接和外部链接,最后保存到本地
下面为部分代码预览,完整代码请点击下载或在bfwstudio webide中打开
#!/usr/local/python3/bin/python3 # -*- coding: utf-8 -* import requests from urllib.request import urlparse, urljoin from bs4 import BeautifulSoup import colorama # init the colorama module colorama.init() GREEN = colorama.Fore.GREEN GRAY = colorama.Fore.LIGHTBLACK_EX RESET = colorama.Fore.RESET # initialize the set of links (unique links) internal_urls = set() external_urls = s.........完整代码请登录后点击上方下载按钮下载查看















网友评论0