以下为《网络爬虫及应用实验报告》的无排版文字预览,完整内容请下载
XX***实验报告
课程名称:python程序设计 院(系):计*** 专业/年级: 软件工程2018级
姓名: 吴某某 学号: ***89
实验八——网络爬虫及应用
实验目的
(1)熟悉常见HTML标签的用法。
(2)理解网页源代码的结构。
(3)掌握requests库的使用。
(4)掌握BeautifulSoup库的使用
实验内容
在认真阅读教材及实验指导书的基础上,完成以下实验内容。
1.编程实现下述功能。
文件ngchina.html保持了网页源代码,请将该页面中图片的URL提取出来,并输出所有图像的URL。
将正确的程序保存于文件ex8.p 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。
def showResults(urls):
count =1
for url in urls:
print("第{:2}个URL:{}".format(count,url))
count +=1
def main():
inputfile="ngchina.html"
htmllines=getHTMLlines(inputfile)
imageUrls=extractImageUrls(htmllines)
showResults(imageUrls)
main()
简述本次实验过程中出现的问题、解决方法、结果如何。
四、实验总结。
[文章尾部最后300字内容到此结束,中间部分内容请查看底下的图片预览]
以上为《网络爬虫及应用实验报告》的无排版文字预览,完整内容请下载
网络爬虫及应用实验报告由用户“Lnny丶玲”分享发布,转载请注明出处