共计 244 个字符,预计需要花费 1 分钟才能阅读完成。
想搞个一亿数据 |
网友回复:
注册 : 今日头条
uov: 百度问答 我在采
DaShi: 这种网站你采集来干什么呢?人家百科网站什么没有?
委员 : 百度百科,百度知道,知乎
louiejordan: wikimedia
好鸭 : 看看
sdqu: 判决文书
laowen: 非学术类,UGC 基本没人管,最多发函撤掉。
ses10086: 这种上亿数据 得靠爬虫爬了。。列表页基本都隐藏了
注册 :
注册 : 大佬,百度问答是百度知道吗?用什么采集的呀
张大牛 : 我抓取百度汉语,每天有几千访问,来自搜狗和 bing,谷歌广告单价太低了
张大牛 : 怎么抓的
正文完