“有目的地的人生才会迷路,我只是来世界散步”:一群段子手喂AI

弱智吧语料让AI性能极快提高,在不少测试中获得高分。至于原因,可能是这些问题增强了AI的逻辑推理能力。

“之前有个吧主就想过,要把我们卖给一个治疗脑病的医院,让我们给举报走了。”

“大模型接受的都是正常的逻辑,弱智吧的逻辑会比较异常,互联网在积累过程中,一些异常逻辑慢慢就淘汰掉了,但是我们保留了弱智吧这个地方,专门留下这种数据”。

发自:上海

责任编辑:顾策

202496日,外滩大会休息室里至少云集了四位院士、两位AI独角兽的创始人、数位金融企业高管。比较扎眼的是,这里还有五位来自弱智吧的代表。

按照官方介绍,外滩大会号称全球三大金融科技大会之一,“具有全球影响力的金融科技和前沿科技大会”,而“弱智吧”是发冷笑话的百度贴吧。

咖啡因来自咖啡果”“生鱼片是死鱼片指南针主要是指北,这些金句都来自弱智吧,中文互联网每年的流行语中,弱智吧总有一席之地。

大佬云集的贵宾休息室里,弱智吧代表们很难不引人注目。穿着统一的白色T 恤,背后印着三个醒目的大字“弱智吧”。比起满屋子听不懂的科技黑话,零食桌才是他们最关心的地方。

“我们在嘉宾室里一直在讨论哪个小吃好吃。”弱智吧吧务胡萝北对每一样零食都印象深刻,“蝴蝶酥、蔓越莓饼干,还有黑金锅巴,都非常好吃,扇贝形状的小甜点有点过于甜腻”有些遗憾的是“自热火锅忘记吃了”。

在外滩大会的官方介绍里,他们还有另一个官方身份:中文训练语料库机构,而且是最好的中文语料。

2024年4月,来自中院、北大、中科大、滑铁卢大学、曼彻斯特大学的研究者们测试了各大中文平台,总共收集了 13 个数据集。

结果,弱智吧打败了知乎、豆瓣、小红书、百科甚至专业技术问答社区思否等平台的语料,成为让AI性能提高最快的语料。它辅导过的大模型在问答、头脑风暴、分类、生成、总结、提取等8 项测试中取得了最高分。至于原因,研究人员在论文中只是简单猜测:可能是弱智吧问题增强了AI的逻辑推理能力。

“弱智吧的价值在于它的独特性。”一位测试过弱智吧语料的大模型专家向南方周末记者解释,“如果训模型是拼图,那么弱智吧就是我们最缺的那一块

吧主公孙闬告诉南方周末记者,“弱智吧不收真弱智,弱智只是一种自嘲”其实弱智吧的门槛并不低,每天他会审几百条帖子,能通过的不超过20%,帖子比较多的时候,“通过率只有5%”。

加入弱智吧的时候,公孙闬还是个小学生。如今他27岁,担任吧主已经第10年。过去20年里,一群业余段子手的自娱自乐,无意间为人工智能留下了一方富矿,这就是弱智吧的故事。

2024年9月6日,弱智吧成员们参加外滩大会。听说他们很多人是学数学的,一位大学教授恍然大悟,“这个就合理了,原来你们是学数学的,你们这就叫大智若愚。”南方周末记者 罗欢欢 图

“挥拳的时候,我们把自己逗笑了”

9月5日,外滩大会开幕前一天夜里,公孙闬直到凌晨12点才赶到酒店。他坐了下来,没和其他人打招呼。他们认识已经七八年,见面还是第一次,之前连对方性别也不清楚,这种感觉“熟悉又陌生”。

聊到段子时,相处才自然起来。三百多万吧友的弱智吧,吧务只有85个。吧主找吧务的标准就是看段子,“写得好,眼熟了,就邀请进吧务群”。进入吧务群里的人,对段子都有相近的审美。

游弋在2017年左

登录后获取更多权限

立即登录

校对:星歌

欢迎分享、点赞与留言。本作品的版权为南方周末或相关著作权人所有,任何第三方未经授权,不得转载,否则即为侵权。

{{ isview_popup.firstLine }}{{ isview_popup.highlight }}

{{ isview_popup.secondLine }}

{{ isview_popup.buttonText }}