博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
14、使用csv和excel存储豆瓣top250电影信息
阅读量:6976 次
发布时间:2019-06-27

本文共 1858 字,大约阅读时间需要 6 分钟。

    记得我们第三关的时候爬取了豆瓣TOP250的电影名/评分/推荐语/链接,现在呢,我们要把它们存储下来,记得用今天课上学的csv和excel,分别存储下来哦~
 
    URL    
 
1 import csv 2 import openpyxl 3 import requests 4 from bs4 import BeautifulSoup 5  6 #   保存成CSV文件 7  8 with open('02.csv','w',newline='',encoding='utf-8') as csv_file: 9     writer = csv.writer(csv_file)10     writer.writerow(['编号','电影名','评分','推荐语','链接'])11 12     for page in range(0,250,25):13         res = requests.get('https://movie.douban.com/top250?start={}&filter='.format(page))14         soup = BeautifulSoup(res.text,'html.parser')15         items = soup.find(class_='grid_view').find_all('li')16         for item in items:17             num = item.find('em').text18             name = item.find('span').text19             rate = item.find(class_='rating_num').text20             try:21                 inq = item.find(class_='inq').text22             except:23                 inq = ''24             url = item.find('a')['href']25                 26             writer.writerow([num,name,rate,inq,url])27 28 #   保存成excel29 30 wb = openpyxl.Workbook()31 sheet = wb.active32 sheet.title = 'TOP250'33 sheet['A1'] = '编号'34 sheet['B1'] = '电影名'35 sheet['C1'] = '评分'36 sheet['D1'] = '推荐语'37 sheet['E1'] = '链接'38 39 for page in range(0,250,25):40     res = requests.get('https://movie.douban.com/top250?start={}&filter='.format(page))41     soup = BeautifulSoup(res.text,'html.parser')42     items = soup.find(class_='grid_view').find_all('li')43     for item in items:44         num = item.find('em').text45         name = item.find('span').text46         rate = item.find(class_='rating_num').text47         try:48             inq = item.find(class_='inq').text49         except:50             inq = ''51         url = item.find('a')['href']52 53         sheet.append([num,name,rate,inq,url])54 55 wb.save('02.xlsx')

 

 
 
 

转载于:https://www.cnblogs.com/www1707/p/10720556.html

你可能感兴趣的文章
ASN.1探索 - 3 编码规则与传输语法(3 - PER)(转)
查看>>
Jmeter+ant+jenkins集成
查看>>
使用 DX 编译 Android应用
查看>>
第一章:Nginx安装
查看>>
React-Native学习指南
查看>>
用cssText属性批量操作样式
查看>>
C语言 Web实时消息后台服务器推送技术---GoEasy
查看>>
警惕javascript变量的全局污染问题
查看>>
response小结(三)—输出随机图片(验证码功能实现)
查看>>
【CentOS7】LINUX下面桌面的安装
查看>>
如何禁止浏览器自动填充非登陆input的账号和密码?
查看>>
jquery(ajax)+ashx简单开发框架(原创)
查看>>
Georgia Tech- 新的篇章
查看>>
易错~~
查看>>
Python 序列化pickle/cPickle模块整理
查看>>
(一)排版样式
查看>>
Maven依赖中的scope详解
查看>>
GIT的使用
查看>>
Jsp+Servlet+JavaBean经典MVC模式理解
查看>>
常用正则表达式
查看>>