
姓名:曹亚男
性别:女
职称:研究员
学位:博士
研究方向: 自然语言处理、社交网络分析、机器学习
Email:caoyanan@iie.ac.cn
课题组主页:https://ascii-iie.github.io/
个人简介:
曹亚男,女,研究员,博士生导师。2006年于山东大学计算机科学与技术学院获得学士学位,2012年于中国科学院计算技术研究所获得博士学位,2015年任信息工程研究所副研究员,2020年任信息工程研究所研究员。研究方向为自然语言处理、社交网络分析、机器学习,具体研究领域包括知识图谱构建与推理、文本生成、图神经网络等。入选2016年度中国科学院信息工程研究所青年之星;获2017年度百度之星开发者大赛第一名;入选2018年度中国科学院青年创新促进会;获2019年度OAG-WHOISWHO大赛第三名;获2020年度PAKDD最佳论文奖;2021年任信工所青促会小组副组长。迄今在包括WWW、AAAI、ICDM、CIKM等CCF-A/B类会议和期刊上发表30余篇学术论文,累计发表EI和SCI检索论文70余篇,论文引用量上千次。连续多年任ACL、AAAI、EMNLP、CIKM程序委员会委员,IJCAI高级程序委员会委员,是TKDE、TIS、FCS、《计算机学报》、《中文信息学报》等国内外学术刊物的审稿人,担任国家自然科学基金和北京市自然科学基金评审专家。先后主持和参与多项国家自然科学基金、国家重点研发计划项目、中科院先导专项等项目,具有丰富的科研经验和项目经验。 在国科大开设研究生课程《深度学习与自然语言处理》、《自然语言处理实战》,深受学生喜爱和好评。
研究方向:
自然语言处理、社交网络分析、机器学习
社会任职:
- 担任ACL 2022 AC、COLING AC、AAAI 2022 SPC、KDD 2022 PC;连续多年担任ACL、IJCAI、EMNLP、WWW、SIGIR等国际会议的程序委员会委员
- 担任IEEE Transactions on Knowledge and Data Engineering、IEEE Transactions on Spatial Algorithms and Systems、计算机学报、自动化学报、中文信息学报等学术期刊审稿人
- 中国计算机学会CCF YOCSEF委员、中国中文信息学会(CIPS)青年工作委员会委员、中国人工智能学会心智计算专委会委员、中国指挥控制学会网络空间测绘专委会委员、中国指挥控制学会开源信息融合专委会委员
- 国家自然科学基金和北京市自然科学基金评审专家
获奖及荣誉:
1. 2013年度信息内容安全技术国家工程实验室特殊贡献奖
2. 2015年度中国科学院信息工程研究所优秀共产党员
3. 2016年度中国科学院信息工程研究所青年之星
4. 2017年度百度之星开发者大赛第一名
5. 2017年度中国科学院信息工程研究所优秀员工
6. 2018年度中国科学院青年创新促进会会员
7. 2019年度OAG-WHOISWHO大赛第三名
8. 2020年度PAKDD最佳论文奖
9. 2021年度中国科学院信息工程研究所室级优秀员工
10. 2021年度中国科学院大学优秀岗位教师
指导学生获奖情况:
1.国家奖学金:张东杰(2019年度)、贾瑞鹏(2021年度)
2.中科院院长奖学金:贾瑞鹏(2022年度院长特别奖)
3.朱李月华奖学金:李晓雪(2020年度)、方正(2021年度)
4.信工所所长奖学金:李晓雪(2018年度)、周玉晨(2019年度)、方正(2020年度)、李韧(2021年度)
5.北京市优秀毕业论文:贾瑞鹏(2022年度)
6.国科大优秀毕业论文:李晓雪(2021年度)、贾瑞鹏(2022年度)
7.信工所优秀毕业论文:徐灏(2019)、李晓雪(2021)、唐恒柱(2021)、康哲舟(2021)、贾瑞鹏(2022)、方正、(2022)、李韧(2022)
近五年代表性论著:
1.(IJCAI-2022) Jiangnan Li, Fandong Meng, Zheng Lin, Rui Liu, Peng Fu, Yanan Cao, Weiping Wang, Jie Zhou. Neutral Utterances are Also Causes: Enhancing Conversational Causal Emotion Entailment with Social Commonsense Knowledge. IJCAI 2022. (CCF-A)
2.(ACL-2022) Ruipeng Jia, Xingxing Zhang, Yanan Cao*, Zheng Lin, Shi Wang, Furu Wei: Neural Label Search for Zero-Shot Multi-Lingual Extractive Summarization. ACL 2022: 561-570 (CCF-A)
3.(WWW-2022) Fengzhao Shi, Yanan Cao*, Yanmin Shang, Yuchen Zhou, Chuan Zhou, Jia Wu. H2-FDetector: A GNN-based Fraud Detector with Homophilic and Heterophilic Connections. WWW 2022: 1486-1494 (CCF-A)
4.(AAAI-2022) Ren Li, Yanan Cao, Qiannan Zhu, Guanqun Bi, Fang Fang*, Yi Liu, Qian Li. How Does Knowledge Graph Embedding Extrapolate to Unseen Data: a Semantic Evidence View. AAAI 2022. (CCF-A)
5.(ACL-2021) Ruipeng Jia, Yanan Cao*, Fang Fang, Yuchen Zhou, Zheng Fang, Yanbing Liu, Shi Wang. Deep Differential Amplifier for Extractive Summarization. ACL 2021. (CCF-A)
6.(AAAI-2021) Ruipeng Jia, Yanan Cao*, Haichao Shi, Fang Fang, Pengfei Yin, Shi Wang. Flexible Non-Autoregressive Extractive Summarization with Threshold: How to Extract a Non-Fixed Number of Summary Sentences? AAAI 2021. (CCF-A)
7.(WWW-2021) Xixun Lin, Jia Wu, Chuan Zhou, Shirui Pan, Yanan Cao, Bin Wang: Task-adaptive Neural Process for User Cold-Start Recommendation. WWW 2021. (CCF-A)
8.(NeurIPS-2020) Shichao Zhu, Shirui Pan, Chuan Zhou, Jia Wu, Yanan Cao*, Bin Wang: Graph Geometry Interaction Learning. NeurIPS 2020. (CCF-A)
9.(WWW-2020) Zheng Fang, Yanan Cao*, Ren Li, Zhenyu Zhang, Yanbing Liu, Shi Wang: High quality Candidate Generation and Sequential Graph Attention Network for Entity Linking. WWW 2020: 640-650. (CCF-A)
10.(AAAI-2020) Xiaoxue Li, Yanan Cao*, Yanmin Shang, Yangxi Li, Yanbing Liu, Jianlong Tan: Type-aware Anchor Link Prediction across Heterogeneous Networks based on Graph Attention Network. AAAI 2020. (CCF-A)
11.(WWW-2019) Zheng Fang, Yanan Cao*, Qian Li, Dongjie Zhang, Zhenyu Zhang, Yanbing Liu: Joint Entity Linking with Deep Reinforcement Learning. WWW 2019: 438-447 (CCF-A)
12.(WWWJ-2022) Yuchen Zhou, Yanmin Shang, Yanan Cao, Qian Li, Chuan Zhou, Guandong Xu: API-GNN: attribute preserving oriented interactive graph neural network. World Wide Web 25(1): 239-258 (2022). (CCF-B)
13.(EMNLP-2021) Zheng Fang, Yanan Cao*, Tai Li, Ruipeng Jia, Fang Fang, Yanmin hang, Yuhai Lu: TEBNER: Domain Specific Named Entity Recognition with Type Expanded Boundary-aware Network. EMNLP (1) 2021: 198-207 (CCF-B)
14.(EMNLP-2021) Kangli Zi, Shi Wang, Yu Liu, Jicun Li, Yanan Cao, Cungen Cao:
SOM-NCSCM : An Efficient Neural Chinese Sentence Compression Model Enhanced with Self-Organizing Map. EMNLP (1) 2021: 403-415 (CCF-B)
15.(WWWJ-2021) Xiaoxue Li, Yanan Cao*, Yanmin Shang, Yangxi Li, Qian Li, Guandong Xu. RLINK: Deep Reinforcement Learning for User Identity Linkage. WWWJ 2020. (CCF-B)
16.(ICASSP-2021) Hengzhu Tang, Yanan Cao*, Zhenyu Zhang, Ruipeng Jia, Fang Fang, Shi Wang. Multi-Granularity Hetegrogeneous Graph For Document-level Relation Extraction. ICASSP 2021. (CCF-B)
17.(EMNLP-2020) Ruipeng Jia, Yanan Cao*, Hengzhu Tang, Fang Fang, Cong Cao, Shi Wang: Neural Extractive Summarization with Hierarchical Attentive Heterogeneous Graph Network. EMNLP (1) 2020: 3622-3631. (CCF-B)
18.(CIKM-2020) Ruipeng Jia, Yanan Cao*, Haichao Shi, Fang Fang, Yanbing Liu, Jianlong Tan. DistilSum: Distilling the Knowledge for Extractive Summarization. CIKM 2020. (CCF-B)
19.(ICDM-2020) Xixun Lin, Chuan Zhou, Hong Yang, Jia Wu, Haibo Wang, Yanan Cao, Bin Wang. Exploratory Adversarial Attacks on Graph Neural Networks. ICDM 2020. (CCF-B)
20.(ICME-2019) Yanmin Shang, Zhezhou Kang, Yanan Cao*, Yanbing Liu, Jianlong Tan: PAAE: A Unified Framework for Predicting Anchor Links with Adversarial Embedding. ICME 2019. (CCF-B)
21.(Journal of Cyber Security-2018) Li guo, Yanan Cao, Majing Su, Yanmin Shang, Yujia Zhu, Peng Zhang, Chuan Zhou. Cyberspace Resources Surveying and Mapping: The Concepts and Technologies, Journal of Cyber Security, 2018(4), 1-14. (CCF-B,论文浏览和下载量达1.5万次)
22.(NAACL-2022) Zheng Fang, Ruiqing Zhang, Zhongjun He, Hua Wu, Yanan Cao. Non-Autoregressive Chinese ASR Error Correction with Phonological Training. NAACL 2022. Accepted. (CCF-C)
23.(NAACL-2022) Yuanxin Liu, Fandong Meng, Zheng Lin, Peng Fu, Yanan Cao, Weiping Wang, Jie Zhou: Learning to Win Lottery Tickets in BERT Transfer via Task-agnostic Mask Training. NAACL 2022. Accepted. (CCF-C)
24.Zhezhou Kang, Yanan Cao, Yanmin Shang, Tao Liang, Hengzhu Tang, Lingling Tong:
Fake News Detection with Heterogenous Deep Graph Convolutional Network. PAKDD (1) 2021: 408-420. (CCF-C)
25. (PAKDD-2020) Hengzhu Tang, Yanan Cao, Zhenyu Zhang, Jiangxia Cao, Fang Fang, Shi Wang, Pengfei Yin. HIN: Hierarchical Inference Network for Document-Level Relation Extraction. PAKDD (1) 2020: 197-209. (CCF-C,Best Paper Award)
承担科研项目情况:
1. 2020.06~2022.12,预先研究项目“人物画像分析技术”,项目负责人
2. 2018.07~2021.06,国家重点研发计划子课题“精准专家推荐与推荐依据可视化呈现技术”,子课题负责人
3. 2016.12~2019.11,国家重点研发计划子课题“虚拟用户画像和关联分析技术研究”,子课题负责人
4. 2015.01~2017.12,国家自然基金青年基金项目“面向事件预测的因果知识发现、验证和推理研究”,项目负责人
5. 2014.01~2017.12,国家自然科学基金面上项目“下一代大数据流分类系统研究”,项目骨干
6. 2013.05~2014.04,中国科学院信息工程研究所前瞻课题“网络信息源发现和信息传播关键技术研究”,项目负责人
7. 2012.01~2016.12,中国科学院战略先导专项:社会态势感知与处理,项目骨干
8. 2018年至2022年,围绕文本内容处理和用户行为分析,承担和参与10余项国家信息安全专项课题