首页 > 热点

复旦大学黄萱菁教授受聘达观数据 热点

作者:萌萌 来源:金投网 2018-04-19 13:37:18

4月18日,达观数据科学家团队再添专家,国内知名自然语言处理领军专家、复旦大学计算机教授黄萱菁博士正式受聘为达观数据高级顾问,达观数据在人工智能领域的研发实力又上新台阶,未来在深度学习、自然语言处理领域,黄教授将...

4月18日,达观数据科学家团队再添专家,国内知名自然语言处理领军专家、复旦大学计算机教授黄萱菁博士正式受聘为达观数据高级顾问,达观数据在人工智能领域的研发实力又上新台阶,未来在深度学习、自然语言处理领域,黄教授将与达观一同推动文本智能处理在各行各业的应用和普及。

图片1.png

在自然语言处理领域,黄萱菁教授赫赫有名,作为国内早期从事人工智能、自然语言处理和信息检索的学者,黄萱菁教授已经在SIGIR, IEEE TKDE, ACL, ICML, IJCAI, AAAI, SCIS, CIKM, ISWC, EMNLP, WSDM和COLING等多个高水平国际学术期刊和会议上发表了近百篇论文,负责的多个科研项目受到国家自然科学基金、科技部、教育部、上海市科委的支持。

黄萱菁教授曾担任过2004年自然语言处理青年学者研讨会(YSSNLP)总召集人,2009年亚洲语义网学术会议(ASWC)组织委员会主席,2010年国际计算语言学学术会议(COLING)tutorial主席,2014年CIKM会议竞赛主席,2015年WSDM会议组织者,2016年全国计算语言学会议程序委员会副主席,2017年国际自然语言处理与中文计算程序委员会主席等。

本次受聘仪式上,黄萱菁教授做了“神经网络与中文分词“的专题分享。

图片2.png

在NLP(自然语言处理)领域,中文分词是很多任务最需要的语言信息处理技术,也是中文结构和语义分析的基础。黄萱菁教授详细介绍了中文分词的几种方法:

1. 基于序列标注的中文分词

2. 基于神经网络的中文分词

3. 基于门递归神经网络的中文分词

4. 基于长短期记忆网络的中文分词

5. 基于对抗网络的多标准分词

黄萱菁教授强调,在分词中结合词典特征来处理罕见词,罕见词常有两个特征,它们是低频词汇,或者特定领域词汇。在词典中可能即包含了常用词汇,也包含了低频词汇和特定领域词汇。

黄萱菁教授表示,很高兴受聘加入达观,达观在算法研发上已经处于国内企业中领先位置,未来希望和达观一起推动自然语言处理在各行业的落地应用,让学术发挥更大价值,也让企业应用到更先进的学术研究成果。

上一篇 下一篇

I 热点 / Hot