设为首页收藏本站 在线游客:
查看: 364|回复: 23

[Python] python爬取抖音作者主页视频

[复制链接]
累计签到:178 天
连续签到:54 天

1968

主题

2791

帖子

3万

积分

总版主

UID
4641
星望
1614
星币
364
星辰
736
好评
215

夜猫子勋章最佳帅哥奖实习版主勋章版主勋章限量纪念勋章星座专属勋章星辰勋章督察勋章灌水天才奖鼎力支持奖热心助人奖优秀会员奖明星会员奖魅力会员奖欢乐天使奖在线大神幸运猪五一勋章总版主勋章中秋勋章

神兽草泥马

发表于 2022-9-9 10:30:00 | 显示全部楼层 |阅读模式

注册后才能看见详细内容以及大图哦!

您需要 登录 才可以下载或查看,没有账号?立即注册

x
  1. import re
  2. import os

  3. import requests


  4. def start(url):
  5.     sec_uid = re.findall('user/(.*)\?', url)[0]  # 从url中提取sec_uid
  6.     max_cursor = '0'  # 初始max_cursor
  7.     quantity = 0  # 初始视频数量
  8.     while True:
  9.         data = requests.get(
  10.             f'https://m.douyin.com/web/api/v2/aweme/post/?reflow_source=reflow_page&sec_uid={sec_uid}&count=21&max_cursor={max_cursor}').json()  # 请求数据
  11.         max_cursor = data['max_cursor']  # 获取max_cursor
  12.         aweme_list = data['aweme_list']  # 获取视频列表
  13.         for aweme in aweme_list:  # 遍历视频列表
  14.             quantity += 1  # 视频数量+1
  15.             video_name = aweme['desc']  # 获取视频名称
  16.             video_url = aweme['video']['play_addr']['url_list'][0]  # 获取视频地址
  17.             nickname = aweme['author']['nickname']  # 获取作者昵称
  18.             print(f'正在下载第{quantity}个视频:{video_name}')  # 打印视频名称
  19.             video_name = video_name.replace('\n', ' ')  # 吧\n替换成空格
  20.             if video_name == '':
  21.                 video_name = str(quantity) + nickname  # 如果视频名称为空,就用视频数量+作者昵称作为视频名称
  22.             if not os.path.exists(f'./{nickname}'):  # 如果作者文件夹不存在,就创建
  23.                 os.mkdir(f'./{nickname}')  # 如果作者文件夹不存在,就创建一个
  24.             with open(f'./{nickname}/{video_name}.mp4', 'wb') as f:
  25.                 f.write(requests.get(video_url).content)
  26.         has_more = data['has_more']
  27.         if not has_more:  # 如果has_more为False 说明没有更多视频了
  28.             break  # 退出循环
  29.     print(f'共下载{quantity}个视频')


  30. if __name__ == '__main__':
  31.     url = input(
  32.         '请输入作者主页链接:')  # 输入作者主页链接 例:https://www.douyin.com/user/MS4wLjABAAAAm-YgirNQo_9nm1B8TNynOD5ZrYBtesVrgBuaZaS2dzQ?vid=6907843457583205646
  33.     headers = {
  34.         'User-Agent': 'Mozilla/5.0 (iPhone; CPU iPhone OS 13_2_3 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.0.3 Mobile/15E148 Safari/604.1'
  35.     }
  36.     url = requests.get(url, headers=headers).url  # 获取重定向后的url
  37.     start(url)
复制代码
游客,如果您要查看本帖隐藏内容请回复


回复帖子免费查看下载地址
只要注册了所有内容都可以看
收集各类收费网站资源免费发放

发帖不代表我在线-定时发帖,论坛所发的软件无明确标注可信度高请务必使用影子系统或虚拟机来运行使用
回复

使用道具 举报

累计签到:31 天
连续签到:1 天

0

主题

82

帖子

336

积分

星光

UID
6093
星望
0
星币
295
星辰
0
好评
0
发表于 2022-9-9 11:43:40 | 显示全部楼层
6
回复 支持 反对

使用道具 举报

累计签到:57 天
连续签到:2 天

0

主题

64

帖子

312

积分

星光

UID
15428
星望
0
星币
280
星辰
0
好评
0
发表于 2022-9-9 21:42:48 | 显示全部楼层
RE: python爬取抖音作者主页视频 [修改]
回复 支持 反对

使用道具 举报

累计签到:52 天
连续签到:5 天

0

主题

86

帖子

370

积分

星光

UID
15872
星望
0
星币
327
星辰
0
好评
0

欢乐天使奖

发表于 2022-9-10 05:32:22 来自手机 | 显示全部楼层
666666666
回复 支持 反对

使用道具 举报

累计签到:57 天
连续签到:2 天

0

主题

64

帖子

312

积分

星光

UID
15428
星望
0
星币
280
星辰
0
好评
0
发表于 2022-9-10 06:43:06 | 显示全部楼层
怎么我用会报错
Traceback (most recent call last):
  File "C:\Users\Admin\Desktop\抖音作者主页爬取.py", line 4, in <module>
    import requests
ModuleNotFoundError: No module named 'requests'
回复 支持 反对

使用道具 举报

累计签到:17 天
连续签到:1 天

0

主题

37

帖子

133

积分

星光

UID
16572
星望
0
星币
114
星辰
0
好评
0
发表于 2022-9-10 09:19:15 | 显示全部楼层
回复 支持 反对

使用道具 举报

累计签到:10 天
连续签到:1 天

0

主题

26

帖子

89

积分

星光

UID
17630
星望
0
星币
76
星辰
0
好评
0
发表于 2022-9-11 18:49:31 | 显示全部楼层
6
回复 支持 反对

使用道具 举报

累计签到:22 天
连续签到:4 天

0

主题

15

帖子

96

积分

星光

UID
17114
星望
0
星币
88
星辰
0
好评
0
发表于 2022-9-12 08:14:11 | 显示全部楼层
感谢分享
回复 支持 反对

使用道具 举报

累计签到:65 天
连续签到:3 天

4

主题

199

帖子

410

积分

星光

UID
7082
星望
0
星币
290
星辰
0
好评
0
发表于 2022-9-14 15:35:38 | 显示全部楼层
6666666666666666666666
回复 支持 反对

使用道具 举报

累计签到:4 天
连续签到:1 天

0

主题

20

帖子

70

积分

星光

UID
19265
星望
0
星币
60
星辰
0
好评
0
发表于 2022-9-18 15:56:48 | 显示全部楼层
666
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|偏爱技术论坛-偏爱技术吧-源码-科学刀-我爱辅助论坛-娱乐网

偏爱技术论坛-偏爱技术吧-源码-科学刀-我爱辅助论坛-娱乐网

GMT+8, 2022-9-26 08:49 , Processed in 0.112721 second(s), 129 queries .

快速回复 返回顶部 返回列表