国际版 Tiktik/Musical.ly service is here: https://github.com/CrawlData/tiktok-sign
更新日志:
- 11月17日 修改请求机制,解决数据抓取时出现假数据的问题
抖音版本更新非常快,但是实际使用的签名算法主要分为两种:
-
as和cp,2.0前的app版本使用,当前该算法仍然可用。可用于数据抓取、深度学习分析。算法代码在main.go文件中,但是关键字段被隐藏,需要请联系作者。
-
as和mas,2.0后的app版本使用,当前app版本已更新到3.4.0,仍使用该算法。
所有演示接口只能测试20次,更多需求Email联系:[email protected],请至少50个汉字描述清晰您的用途(少于50个字不回复)。 如发现抓取到假数据,可联系作者。
所有演示请求基于以下服务地址:
https://crawldata.app/api/douyin
curl -X "POST" "https://crawldata.app/api/douyin/v2/sign" \
-H 'Content-Type: application/json' \
--insecure \
-d $'{
"url": "https://aweme.snssdk.com/aweme/v1/feed/?type=0&max_cursor=0&min_cursor=-1&count=6&volume=0.3333333333333333&pull_type=2&need_relieve_aweme=0&filter_warn=0&req_from&is_cold_start=0&js_sdk_version=1.2.2&app_type=normal&manifest_version_code=321&_rticket=1541682949911&ac=wifi&device_id=59121099964&iid=50416179430&os_version=8.1.0&channel=gray_3306&version_code=330&device_type=ONEPLUS%20A5000&language=zh&vid=C2DD3A72-18E8-490e-B58A-86AD20BB8035&resolution=1080*1920&openudid=27b34f50ff0ba8e26c5747b59bd6d160fbdff384&update_version_code=3216&app_name=aweme&version_name=3.3.0&os_api=27&device_brand=OnePlus&ssmix=a&device_platform=android&dpi=420&aid=1128"
}'
https://crawldata.app/api/douyin/v2/device/gen
新版 as、mas版本 | 旧版 as、cp版本 | |
---|---|---|
首页动态 | /v2/feed | /v1/feed |
视频列表 | /v2/aweme/post | /v1/aweme/post |
喜欢列表 | /v2/aweme/favorite | /v1/aweme/favorite |
个人信息 | /v2/user | /v1/user |
关注列表 | /v2/user/following/list | /v1/user/following/list |
粉丝列表 | /v2/user/follower/list | /v1/user/follower/list |
视频评论 | /v2/comment/list | /v1/comment/list |
商品橱窗 | /v2/user/promotions | |
直播列表 | /v2/room/feed | |
热门话题 | /v2/category/list | /v1/category/list |
话题视频 | v2/challenge/aweme | v1/challenge/aweme |
话题详情 | v2/challenge/detail | v1/challenge/detail |
搜索用户 | v2/search/discover | v1/search/discover |
搜索音乐 | v2/search/music | v1/search/music |
搜索话题 | v2/search/challenge | v1/search/challenge |
搜索视频 | v2/search/item |
https://github.com/CrawlData/douyin-ads
这里有一篇关于Android逆向工程的文章,反编译了抖音的libuserinfo.so文件的种种加密入口限制,使得自己的Android程序可以调用该so文件直接加密校验。这样的效果就是无需真正意义破解加密算法。我这里直接以as、cp版本的协议讲解加密算法本身。火山小视频也一样。
- 在查询串插入一个固定的键rstr
- 对查询串进行按键排序并取值,对空格和+进行转义为a
- 然后取MD5;如果时间轴&1为1,那么取多一次MD5
- 将MD5结果分别和56、14进行2次错位排序算法
- 将4的结果再进行一次错位排序,得到36位字符
- 将字符分别取18位给到as和cp字段,追加到查询串最后
在最新的SDK版本有了新的mas字段辅助校验,这个完全可以忽略,只要把查询串的version_code设置到169之前就可以跳过这个字段了。 另外aid为必填字段,其他和接口本身无关的字段都可去掉。 由于这里涉及到抖音公司的核心利益,就不放具体代码和关键Key值了
以上演示的是as、cp版本的算法加密过程。 我的Email是:[email protected]