Social Media Data

Tencent

this is the mapping between transformed and original fields in Tencent.

Original Field Transformed Field Description
id _id Uniquene ID In NExT UGC Data
id id Uniquene ID In Tencnet
text text 微博内容
count retct 微博被转次数
mcount comct 点评次数
from sourc 来源
fromurl fromu 来源
image image 图片url列表
video vd 视频信息
video/picurl vd/pu 缩略图
video/player vd/py 播放器地址
video/realurl vd/ru 视频原地址
video/shorturl vd/su 视频的短url
video/title vd/tt 视频标题
music mu 音频信息
music/author mu/au 演唱者
music/url mu/ul 音频地址
music/title mu/tt 音频名字,歌名
name sname 发表人帐户名
name uid 发表人帐户名
openid openid 用户唯一id,与name相对应
nick name :发表人昵称
self self 是否自已发的的微博,0-不是,1-是
timestamp times 发表时间
crtdt crtdt 发表时间(转换后的时间)
retid retid retweetid/转发微博id
type type 微博类型,1-原创发表,2-转载,3-私信,4-回复,5-空回,6-提及,7-评论
head head 发表者头像url
location loc 发表者所在地
latitude lat  
longitude logit  
country_code counc 国家码(与地区发表时间线一样)
province_code provc 省份码(与地区发表时间线一样)
city_code cityc 城市码(与地区发表时间线一样)
isvip isvip 是否微博认证用户,0-不是,1-是
geo geo 发表者地理信息
status status 微博状态,0-正常,1-系统删除,2-审核中,3-用户删除,4-根删除
fetchDate fetdt data fetch time
isent isent 是否企业用户
introduction desc 个人介绍
verifyinfo vefrs 认证信息
email email 邮箱
birth_year byear 出生年
birth_month bmonth 出生月
birth_day bday 出生天
sex g 用户性别,1-男,2-女,0-未填写
fansnum folct 听众数
idolnum frdct 收听的人数
tweetnum stact 发表的微博数
tag tag  
edu edu  
edu/year edu/year 入学年
edu/schoolid edu/schid 学校id
edu/departmentid edu/depart 院系id
edu/level edu/level 学历级别
isrealname isrln  
favnum favct  
exp exp  
level level  
comp comp  
comp/begin_year comp/bey  
comp/company_name comp/compn  
comp/department_name comp/deptn  
comp/end_year comp/edy  
hometown_code htcd  
homecity_code hcicd  
homeprovince_code hpcd  
homecountry_code hcocd  
homepage burl  
regtime regtime  
send_private_flag almsgf  
mutual_fans_num bfc  
origin origin data original source(Tencent)
classification classification data classification in NExT
docloc docloc  
lang lang language