网址详情

image

NLPIR语义分析系统 1631

http://ictclas.nlpir.org/nlpir/



NLPIR大数据搜索与挖掘共享平台(以下简称NLPIR),汇智语言理解,掘金内容价值,让数据成为智慧,助力企业发展。



云计算、智慧城市、移动互联网、大数据与物联网已经成为大数据时代的技术特征,实现了人、机器与实物的多维互联互通。大数据分为结构化大数据与非结构化大数据,非结构化大数据的生产、搜索、挖掘与分析已经成为了当前研究的热点与难点,并且大数据搜索、挖掘与可视化等落地的工程实践尚有较大距离,这也是当下的工程急需。

NLPIR大数据搜索与挖掘平台简介



NLPIR能够全方位多角度满足应用者对大数据文本的处理需求,包括大数据完整的技术链条:网络抓取、正文提取、中英文分词、词性标注、实体抽取、词频统计、关键词提取、语义信息抽取、文本分类、情感分析、语义深度扩展、繁简编码转换、自动注音、文本聚类等。

NLPIR所有功能模块全部备有对应的二次开发接口(动态链接库.dll,.so,及静态链接库等形式),平台的各个中间件API可以无缝地融合到客户的各类复杂应用系统之中,可兼容Windows,Linux, Android,Maemo5, FreeBSD,麒麟等不同操作系统,开发者可使用Java,C/C++,C#, Python,Php, R等各类主流开发语言调用其所有功能。

NLPIR大数据搜索与挖掘在线平台功能介绍

本演示平台支持Chrome、Firefox、IE(9+)、UC、360(极速模式)等主流浏览器。

模块介绍请点击各个模块的右上角的文本图标链接。

网络信息实时采集与正文提取



NLPIR演示平台根据新浪rss摘要,利用NLPIR的精准网络采集系统实时抓取新浪最新的新闻(每次刷新均会重新抓取)。NLPIR正文提取系统将网页中的导航、广告等内容去除,利用网络文本链接密度作为主要参数,采用深度神经网络模型,实现文本正文内容的自动提取。

也可以直接在网页URL里粘贴任何网站的链接,点击抓取,则可以抓取到该URL网页的正文,然后点击分析,则可以对该篇文章经行分析。

当然,也可由用户人工自由输入任意的文章。为了确保服务的速度,在线演示系统的文章字数限制在30——3000字。

NLPIR大数据搜索与挖掘平台主要优势

技术优势

NLPIR由多名专注于大数据科学研究与工程应用融合领域的博士硕士,不断创新,倾力打造十余年。并分别荣获了2010年钱伟长中文信息处理科学技术奖一等奖,2002年国内973评测综合第一名,2003年国际SIGHAN分词大赛综合第一名。综合平衡了效果与效率,实现了 “又好又快”的技术追求。

普适优势

NLPIR提供丰富的open API,可无缝地融合到客户的各类复杂操作系统之中,开发者可使用各类主流开发语言调用其所有功能。

经验优势

十余年中,NLPIR先后服务了全球30万家机构,其中涵盖了中央网信办、中国证监会、中国人民银行、国家统计局、国家气象局等国家机构,中信信托、华为、人民网、中国移动、中国邮政等大型商业机构,以及中国科学院、清华大学、中国科技信息情报研究所等科研机构。

image