现在已经有近百个答案了,但是没有人提到一个几乎每个国人、每天都会接触到的人工智能应用——内容审核[1]. 随者深度学习的引入,内容审核技术出现了突飞猛进的发展,它比大家日常能看见的人脸识别、导航、内容推荐等等技术都发展的更快,应用更丰富,形态更多样。目前已经远远超出一般人的想象。
先说一般形态的内容审核,这类形态的内容审核还在一般人的想象之中,技术比较简单,也是经常被感知到的。包括但不限于:
关键词审核
[2]
也就是“上面”和网络社区各自建立和维护一个关键词黑名单,然后使用关键词命中的方式进行审核。当然,关键词命中可能导致一些意外的名称组合被错误命中(典型地,AB是一个关键词,但CA和BD分别是一个词组,当CABD顺序出现时候会导致错误命中),因此,一些网络社区引入了智能分词技术进行关键词审核,大幅避免这种错误命中的情况[3][4],减少用户的被审核感知。
2. 话题审核[5]
话题审核一般通过话题索引、hashtag的方式进行审核,应用于头部话题,通常有人工审核介入。通常地,如果不加审核,任何包括对应的hashtag的内容都会出现在其他用户的timeline上,但引入审核后,会针对性的进行内容曝光控制,对于不符合口径管控方向的内容,形成作者可见而关注者不可见的情况,或者减少内容分发/曝光,从而消除或者减少其影响,并降低被审核用户的感知。
3. 事后追溯
以某个内容的在敏感人群中的曝光突然增加为激活条件进行事后的人工介入审核,删除或者减少曝光/分享。
4. 其他
以上都是比较简单的形式,在深度学习和算力解锁之后,我们正在体会一些新的形式,包括但不限于
1.社交图网络用户画像
根据用户之间的聊天交互、家庭关系、联系人列表、买卖关系、地理关系、商业关系等构件十亿个顶点,万亿条边以上的超大规模社交图网络[6],在该网络下,对极小比例的敏感用户进行标定,就可以对十亿量级的人口进行足够准确的刻画,包括其性格、政治取向、言论风格、影响力等等。
据此可以动态划定少部分敏感人群进行人工介入的重点关注,甚至对其在微信、微博、电话等所有线上平台的所有内容的无差别逐一审核。
2.多模态信息内容理解和意图判定[7]
文本、图像、视频、语音等内容在时间线上相邻关系意味着它们之间具有内容的相关性,多模态信息内容理解可以从聊天、朋友圈、想法、微博等具有时间线性质的内容中更准确地提取内容的信息,判定其敏感性,并分析参与时间线讨论的用户的根本意图[8][9], 从而在人工不介入的情况下近实时地锁定敏感用户,进行定向督导。
3. 信息流分发干预
传统上理解,审核是一个被动的动作,需要在用户发表内容之后做出。但是信息流分发干预可以在用户不感知的情况下,更多地、隐含地给用户曝光一些不引起其反感的受控内容,从而在长期上改变用户对社会的认知,改变其政治取向[10],对用户言论发表产生积极主动而且稳定的影响[11],纠正用户的错误观念和错误记忆,甚至可以在中长期达到治本的目的,有效地减少审核算力和人工审核压力,维护社会文明和稳定,助力社会和谐。
4. 注意力调离
当出现主流价值和思想体系下无法自洽的新闻热点事件时,对用户推送其他争议性热点,有效地分散用户的注意力[12][13],减少用户的感知扰动,从而减少其极端言论输出的可能性,维护社会稳定。
5. 其他
在深度学习技术的助力下,审核不再以固定的关键词存在,而是以动态的形式存在。这种情况下,用户无法对审核规则进行准确感知,提高了审核的不可知性,降低了用户与审核对抗的意图。审核技术日新月异,限制它的不是算力和技术,而是我们的想象力。
参考
^Xu, B., & Albert, E. (2014). Media censorship in China. Council on Foreign Relations, 25, 243.
^Xu, X., Mao, Z. M., & Halderman, J. A. (2011, March). Internet censorship in China: Where does the filtering occur?. In International Conference on Passive and Active Network Measurement (pp. 133-142). Springer, Berlin, Heidelberg.
^Huang, H., Wang, X., & Wang, H. (2020). NER‐RAKE: An improved rapid automatic keyword extraction method for scientific literatures based on named entity recognition. Proceedings of the Association for Information Science and Technology, 57(1), e374.
^Song, Y., Kim, E., Lee, G. G., & Yi, B. K. (2004). POSBIOTM-NER in the Shared Task of BioNLP/NLPBA2004. In Proceedings of the International Joint Workshop on Natural Language Processing in Biomedicine and its Applications (NLPBA/BioNLP) (pp. 103-106).
^Liao, S. (2019). “# IAmGay# What About You?”: Storytelling, Discursive Politics, and the Affective Dimension of Social Media Activism against Censorship in China. International Journal of Communication, 13, 21.
^Chaudhary, A., Mittal, H., & Arora, A. (2019, February). Anomaly detection using graph neural networks. In 2019 International Conference on Machine Learning, Big Data, Cloud and Parallel Computing (COMITCon) (pp. 346-350). IEEE.
^Dey, N., Ashour, A. S., & Nguyen, G. N. (2020). Recent advancement in multimedia content using deep learning.
^Froehlich, D. E., Rehm, M., & Rienties, B. C. (2020). Mixed methods social network analysis. Mixed methods social network analysis: Theories and methodologies in learning and education, 1-10.
^Hu, M., Peng, J., Zhang, W., Hu, J., Qi, L., & Zhang, H. (2021). An intent recognition model supporting the spoken expression mixed with Chinese and English. Journal of Intelligent & Fuzzy Systems, 40(5), 10261-10272.
^Sparr, M. (2022). Explicit User Manipulation in Reinforcement Learning Based Recommender Systems. arXiv preprint arXiv:2203.10629.
^Papakyriakopoulos, O., Serrano, J. C. M., & Hegelich, S. (2020). Political communication on social media: A tale of hyperactive users and bias in recommender systems. Online Social Networks and Media, 15, 100058.
^Paasonen, S. (2016). Fickle focus: Distraction, affect and the production of value in social media. First Monday.
^Xie, J. Q., Rost, D. H., Wang, F. X., Wang, J. L., & Monk, R. L. (2021). The association between excessive social media use and distraction: An eye movement tracking study. Information & Management, 58(2), 103415.