第02章:TikTok Shop的数据地图

第02章:TikTok Shop的数据地图

在你开始写代码之前,你需要先知道地图长什么样——哪些数据存在,在哪里可以获取,获取的难度和合规风险分别是什么。


TikTok Shop(字节的海外电商平台)是这本书的主要战场。

为什么选TikTok Shop而不是亚马逊?

  • 数据更新频繁,机会窗口更短(卖家更需要实时监控)
  • 达人带货生态复杂,数据需求更高
  • 竞争对手工具(Kalodata、Shoplus等)不够精细,定制空间大
  • 平台还在快速增长,整个市场比亚马逊更早期

TikTok Shop的数据来源

来源1:TikTok官方平台(公开可见)

TikTok应用和网页端,展示了大量公开信息:

  • 商品页面:商品名称、价格、已售数量、评分、评论数
  • 达人主页:粉丝数、作品数、最近视频(带货视频可见)
  • 直播回放:带货品类、播放量数据
  • 话题页面:话题视频数量、浏览量

可获取方式:网页端爬取(HTTP请求 + HTML解析)

难度:中等(有反爬机制,需要处理)

合规风险:中等(爬取公开信息,但需注意频率控制,避免影响平台正常运营)


来源2:TikTok官方API

TikTok提供了部分官方API,分为两个层级:

TikTok for Business API:主要面向广告主,可获取广告数据、受众分析。需要申请,有审核。

TikTok Shop Partner API:面向TikTok Shop的官方合作伙伴,可获取商品、订单、结算等数据。需要商家账号和申请。

直接可用性:个人开发者申请门槛较高,但了解API能帮助你理解数据结构,也可以通过帮商家申请接入来提供服务。


来源3:第三方数据平台(二次开发/合作)

市场上已有的TikTok数据平台(Kalodata、Shoplus、Fastmoss等),本身提供了网页界面的数据查看功能。

两种利用方式

  1. 作为研究工具,了解哪些数据存在、数据长什么样
  2. 通过他们的API(部分平台提供),直接获取已经处理好的结构化数据

Kalodata和Shoplus都有API订阅计划($50-200/月),对于数据质量要求高、不想自己维护爬虫的场景,这是合理的选择。


数据地图:你能获取的主要维度

数据类型 来源 获取难度 卖家需求
商品排行榜(按销量/评分) 平台爬取
商品价格变化追踪 平台爬取
达人基本信息(粉丝/互动率) 平台爬取
达人历史带货记录 平台爬取+三方平台
直播间实时数据 较难(需要实时监控)
关键词搜索量趋势 TikTok广告API / 三方
商品评论情感分析 平台爬取+NLP

TikTok数据的技术结构

了解TikTok的数据结构,对你写抓取代码非常重要。

打开TikTok网页版,打开浏览器开发者工具(F12),在Network选项卡里,你可以看到前端页面请求的API端点。

常见的数据端点(举例,实际端点可能随版本更新而变化)

  • 商品搜索数据:/api/search/general/full/
  • 达人信息:/api/user/detail/
  • 视频数据:/api/post/item/detail/

这些端点返回JSON格式的数据,包含你需要的大多数字段。

获取这些数据的通用方法

import requests
import json

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36",
    # 从浏览器开发者工具里复制Cookie和其他请求头
    "Cookie": "YOUR_COOKIE_HERE"
}

# 实际URL和参数需要从浏览器Network面板里复制
url = "https://www.tiktok.com/api/..."
response = requests.get(url, headers=headers)
data = response.json()

工具选择

爬取工具

  • requests:最基础的HTTP请求库,适合简单接口
  • httpx:支持异步,适合批量请求
  • playwright / selenium:用于需要浏览器渲染的页面(有JavaScript动态内容)

数据处理

  • pandas:数据处理的标准工具
  • sqlite3:内置Python库,保存抓取的数据

定时执行

  • Windows:任务计划程序(Task Scheduler)
  • macOS/Linux:cron

数据展示

  • Excel(openpyxl库):直接发给客户
  • 简单的HTML报告(jinja2模板)
  • Telegram/微信通知(API推送关键变化)

本章小结

在开始写代码之前,你需要:

  1. 了解哪些数据存在(本章的数据地图)
  2. 了解可以用什么方式获取(官方API / 爬取 / 三方平台)
  3. 了解技术复杂度和合规风险(第9章会详细讲)

下一步:用浏览器开发者工具,亲自去分析TikTok的请求,找到你第一个脚本会用到的API端点。这个操作花30分钟,收获远大于看任何教程。


→ 第3章:爆品监控脚本实战