第02章:TikTok Shop的数据地图
第02章:TikTok Shop的数据地图
在你开始写代码之前,你需要先知道地图长什么样——哪些数据存在,在哪里可以获取,获取的难度和合规风险分别是什么。
TikTok Shop(字节的海外电商平台)是这本书的主要战场。
为什么选TikTok Shop而不是亚马逊?
- 数据更新频繁,机会窗口更短(卖家更需要实时监控)
- 达人带货生态复杂,数据需求更高
- 竞争对手工具(Kalodata、Shoplus等)不够精细,定制空间大
- 平台还在快速增长,整个市场比亚马逊更早期
TikTok Shop的数据来源
来源1:TikTok官方平台(公开可见)
TikTok应用和网页端,展示了大量公开信息:
- 商品页面:商品名称、价格、已售数量、评分、评论数
- 达人主页:粉丝数、作品数、最近视频(带货视频可见)
- 直播回放:带货品类、播放量数据
- 话题页面:话题视频数量、浏览量
可获取方式:网页端爬取(HTTP请求 + HTML解析)
难度:中等(有反爬机制,需要处理)
合规风险:中等(爬取公开信息,但需注意频率控制,避免影响平台正常运营)
来源2:TikTok官方API
TikTok提供了部分官方API,分为两个层级:
TikTok for Business API:主要面向广告主,可获取广告数据、受众分析。需要申请,有审核。
TikTok Shop Partner API:面向TikTok Shop的官方合作伙伴,可获取商品、订单、结算等数据。需要商家账号和申请。
直接可用性:个人开发者申请门槛较高,但了解API能帮助你理解数据结构,也可以通过帮商家申请接入来提供服务。
来源3:第三方数据平台(二次开发/合作)
市场上已有的TikTok数据平台(Kalodata、Shoplus、Fastmoss等),本身提供了网页界面的数据查看功能。
两种利用方式:
- 作为研究工具,了解哪些数据存在、数据长什么样
- 通过他们的API(部分平台提供),直接获取已经处理好的结构化数据
Kalodata和Shoplus都有API订阅计划($50-200/月),对于数据质量要求高、不想自己维护爬虫的场景,这是合理的选择。
数据地图:你能获取的主要维度
| 数据类型 | 来源 | 获取难度 | 卖家需求 |
|---|---|---|---|
| 商品排行榜(按销量/评分) | 平台爬取 | 中 | 高 |
| 商品价格变化追踪 | 平台爬取 | 中 | 高 |
| 达人基本信息(粉丝/互动率) | 平台爬取 | 中 | 高 |
| 达人历史带货记录 | 平台爬取+三方平台 | 高 | 高 |
| 直播间实时数据 | 较难(需要实时监控) | 高 | 中 |
| 关键词搜索量趋势 | TikTok广告API / 三方 | 高 | 中 |
| 商品评论情感分析 | 平台爬取+NLP | 中 | 中 |
TikTok数据的技术结构
了解TikTok的数据结构,对你写抓取代码非常重要。
打开TikTok网页版,打开浏览器开发者工具(F12),在Network选项卡里,你可以看到前端页面请求的API端点。
常见的数据端点(举例,实际端点可能随版本更新而变化):
- 商品搜索数据:
/api/search/general/full/ - 达人信息:
/api/user/detail/ - 视频数据:
/api/post/item/detail/
这些端点返回JSON格式的数据,包含你需要的大多数字段。
获取这些数据的通用方法:
import requests
import json
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36",
# 从浏览器开发者工具里复制Cookie和其他请求头
"Cookie": "YOUR_COOKIE_HERE"
}
# 实际URL和参数需要从浏览器Network面板里复制
url = "https://www.tiktok.com/api/..."
response = requests.get(url, headers=headers)
data = response.json()
工具选择
爬取工具:
requests:最基础的HTTP请求库,适合简单接口httpx:支持异步,适合批量请求playwright/selenium:用于需要浏览器渲染的页面(有JavaScript动态内容)
数据处理:
pandas:数据处理的标准工具sqlite3:内置Python库,保存抓取的数据
定时执行:
- Windows:任务计划程序(Task Scheduler)
- macOS/Linux:cron
数据展示:
- Excel(openpyxl库):直接发给客户
- 简单的HTML报告(jinja2模板)
- Telegram/微信通知(API推送关键变化)
本章小结
在开始写代码之前,你需要:
- 了解哪些数据存在(本章的数据地图)
- 了解可以用什么方式获取(官方API / 爬取 / 三方平台)
- 了解技术复杂度和合规风险(第9章会详细讲)
下一步:用浏览器开发者工具,亲自去分析TikTok的请求,找到你第一个脚本会用到的API端点。这个操作花30分钟,收获远大于看任何教程。
→ 第3章:爆品监控脚本实战