题名:
网络爬虫全解析   wang luo pa chong quan jie xi / 罗刚著 ,
ISBN:
978-7-121-31071-3 价格: CNY79.00
语种:
chi
载体形态:
12,429页 图 24cm
出版发行:
出版地: 北京 出版社: 电子工业出版社 出版日期: 2017
内容提要:
本书介绍了如何开发网络爬虫。内容主要包括开发网络爬虫所需要的Java语法基础和网络爬虫的工作原理,如何使用开源组件HttpClient和爬虫框架Crawler4j抓取网页信息,以及针对抓取到的文本进行有效信息的提取。为了扩展抓取能力,本书介绍了实现分布式网络爬虫的关键技术。另外,本书介绍了从图像和语音等多媒体格式文件中提取文本信息,以及如何使用大数据技术存储抓取到的信息。 
主题词:
软件工具   程序设计
中图分类法:
TP311.56 版次: 5
主要责任者:
罗刚 luo gang 著
责任者附注:
罗刚,猎兔搜索创始人,带领猎兔搜索技术开发团队先后开发出猎兔中文分词系统、猎兔问答系统、猎兔信息提取系统、猎兔智能垂直搜索系统以及网络信息监测系统等,实现互联网信息的采集、过滤、搜索和实时监测。 
索书号:
TP311.56/6022