快手用户数据爬取与解析

发布时间:2024-12-20 05:14

健康应用同步:与手机健康应用数据互联,便于数据分析。 #生活技巧# #数码产品使用技巧# #智能手表功能解析#

快手字体反爬

最新推荐文章于 2024-10-21 19:19:02 发布

s_kangkang_A 于 2020-07-23 15:22:50 发布

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

import re

import requests

from fontTools.ttLib import TTFont

def kuaishou(id):

headers = {

'User-Agent': 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.116 Mobile Safari/537.36',

'Cookie': 'did=web_5f471e2368cf4a9980790fe557a624a2'

}

url = 'https://c.kuaishou.com/fw/user/{}'.format(id)

resp = requests.get(url, headers=headers)

content = resp.text

print(content)

ttf_url = re.search('"fontCdnUrl":"(.*?)"', resp.text).group(1).strip()

print(ttf_url)

ttf_resp = requests.get(ttf_url)

try:

with open('ks.ttf', 'wb') as f:

f.write(ttf_resp.content)

except Exception as e:

print(e)

font = TTFont('ks.ttf')

font.saveXML('ks.xml')

uni_list = font.getGlyphOrder()[1:]

first_map = {}

for i, uni in enumerate(uni_list):

if i == 10:

i = '.'

first_map[uni] = i

bestcmap = font['cmap'].getBestCmap()

newmap = dict()

for key, value in bestcmap.items():

key = hex(key)

newmap[key] = value

real_map = {}

for k, v in newmap.items():

for x, y in first_map.items():

if x == v:

key = re.sub('0x', '&#x', k)

real_map[key] = y

for key, value in real_map.items():

if key in content:

content = content.replace(key, str(real_map[key]))

print(content)

fans = re.search("<SPAN STYLE='FONT-FAMILY: kwaiFont;'>(.*?)</SPAN>w?", content, re.S).group(1).strip()

fans = re.sub(';', '', fans)

if '.' in fans:

fans = round(float(fans) * 10000)

else:

fans = int(fans)

print(fans)

if __name__ == '__main__':

kuaishou('SB810810810')

网址:快手用户数据爬取与解析 https://www.yuejiaxmz.com/news/view/523683

相关内容

python爬虫与数据分析之《向往的生活爬取》
Python爬虫抓取基金数据分析、预测系统设计与实现——云诺说
快手CNY用户数据洞察报告
深度|用户节电的大数据分析及应用
实时数据分析:实时数据流与实时应用场景
python爬取B站千万级数据,发现了这些热门UP主的秘密!
python爬虫实现实时爬取学校最新通知并推送
全面的数据,全面数据分析与报告
消费者行为解码:社交媒体数据分析的商业智能洞察
【毕业设计】大数据睡眠数据分析与可视化

随便看看