全球要闻:当ChatGPT的子弹射中知乎

毫无疑问,ChatGPT 已然成为 2023 上半年最有影响力的商业话题。


【资料图】

ChatGPT 横空出世仅百余天便让整个互联网都为之躁动,心有猛虎的公司都在寻找向上攀爬的入口——“文心一言”之于百度、“通义千问”之于阿里、百川智能之于王小川,国内已有数十家企业相继入局。

形势不等人,知乎也纵身一跃跳入了这股时代浪潮——今天(4月13日),知乎正式发布“知海图 AI ”中文大模型,并通过联合研发与战略投资的方式与国内顶尖大模型团队面壁智能达成深度合作,共同开发中文大模型产品并推进应用落地。

知乎押注中文大模型的深层次原因在于:

一方面,中国移动互联网业到了用户、流量趋于见顶的成熟期,监管会更侧重产业互联网的推进与建设,这意味着技术走到平台重构生态的关键时期—— ChatGPT 热潮席卷而来,无人愿意缺席这场盛宴,知乎坐拥中文语料底层最优质提示词和庞大语料库,有得天独厚的壁垒优势。

以知乎上“ChatGPT”讨论数据为例,该话题热度已经打破 2015 年以来“AlphaGo”话题创下的纪录,当前讨论累计超 22 万,总浏览量超 3.8 亿。

另一方面,在快速迭代的科技推动下,互联网公司一直生活在浮冰上,通用人工智能时代呼啸而来,ChatGPT 与生俱来便契合内容社区,知乎手握应用层及数据层的独特优势,必须在快速发展时期进行果断投入(包括技术生态迭代、研发投入等),从而博一张未来的船票。

“知乎所处的环境和阶段,丝毫不容许任何懈怠。快则生,慢则死。”知乎创始人、董事长兼 CEO 周源曾在内部信如此形容知乎所处形势之迫切。

只不过,面对雨后春笋般冒出来的类 ChatGPT 产品,知乎不仅要向市场证明“知海图AI”的竞争力,还要向内协同好这一场基于 AI 革命的“基因重组”。

知乎何以被 ChatGPT 击中?

自2022 年 11 月 31 日问世算起,ChatGPT 的火已经“烧”了四个多月。据 Similarweb 统计,今年一月以来, ChatGPT 平均每日在线人数达到 1300 多万,比去年 12 月增长了一番,并一举打破产品跨入亿级俱乐部的最快纪录。

面对席卷而来的 AI 热浪,知乎在 2 月份一度被炒成“ ChatGPT 概念股”,市值向上爬了一大截。彼时,周源只是浅谈技术布局,并未公布具体的产品计划。

没曾想,两个月后,知乎便毅然躬身入局——“2023 知乎发现大会”上,周源正式宣布:知乎海盗船迎来了新时代的AI船员——“知海图AI”中文大模型。

虎嗅据悉,“知海图 AI”中文大模型主要将应用于知乎“热榜”,产品会将聚合问题下优质回答的重要观点,经 AI 算法模型整理润色后外显展示,提高用户获取信息的效率。值得一提的是,这款应用面壁智能开发的大语言模型产品,在内测中与 GPT-4 对比都丝毫不逊色。

对此,周源乐观地判断,知乎社区引入 AI 工具后会催生奇妙的“化学反应”。“AI 时代的生产力要素可以分为三层,从上到下依次是:应用场景、专有数据、基础模型。知乎之所以从应用场景切入,主要是基于问答的‘讨论场’仍在不断增长,社区内的关系和知识图谱是独一无二的‘专有数据’,能帮助 GPT 为代表的‘基础模型’层进行数据训练,加速性能优化、降低成本。”

这并非盲目的自信。

首先,有价值的内容是知乎的核心资产,也是它能够成为“ChatGPT 概念股”的重要原因,否则微软集成 ChatGPT 技术的新版必应回答中也不会有那么多高质量答案来自知乎。

其次, ChatGPT 提供的答案也需要从数据库进行“提取加工”,其本质上缺乏底层原创能力,而知乎的价值在于庞大的创作者队伍源源不断为原创“泵血”——截止 2022Q4,知乎的问答量已经累计达到 5.06 亿条,这些持续产出的精品内容如同“燃料”般不断反哺更多搜索引擎、大语言模型,进而使中文大模型语料库越发精进。

尤其,知乎在应用层和数据层具备得天独厚的优势:

一方面,知乎作为国内高质量中文互联网问答平台,良性讨论氛围和高质量内容沉淀是其根基,用户在知乎并不会被不同文化圈层所阻碍,同一个问题可能存在数个不同切面、甚至截然相反的回答,赞同/反对机制极大规避了算法至上造成的“信息茧房”,既是对内容质量的一种主动筛选,也是对 AIGC 大模型开发的天然优势。

对此,科技媒体人“望月的博客”曾撰文指出:“知乎是基于‘认知盈余’建立起来的知识社区,用户在这里提出问题、分享‘认知盈余’本身就已经是一种收获。而这些收益,可以算得上是‘认知盈余’换来的额外收益,是一种站着把钱赚了的优雅模式,和写软文发硬广的体验全然不同。”

另一方面,知乎的社区氛围使提问、回答、讨论生态自循环。相比“双微一抖”(微信公众号、微博、抖音)内容生命周期更长,且知乎的高赞内容、热门问答会长时间优先展示,长尾效应明显,具备不可替代的场景心智。

当然,知乎这次拉来助阵的面壁智能,也让周源多了一些底气——作为国内最早开展大规模语言模型研究的团队,面壁智能是创始成员主要来自于清华大学计算机系自然语言处理与社会人文计算实验室(THUNLP),拥有深厚的自然语言处理和预训练模型研究基础。

网友可能对这个清华班底的创业公司知之甚少,但其在 AI 界的实力并不容小觑——其是最早提出知识指导预训练模型 ERNIE的团队,且开源发布国内首个中文大模型 CPM-1、高效易用大模型 CPM-2、可控持续大模型 CPM-3、国内首个法律领域大模型Lawformer、生物医学领域大模型 KV-PLM 等。

不过,外界担忧知乎在引入 AI 后会一定程度冲击到社区创作生态。

通俗点说,应用大语言模型产品依托的是算法、算力和数据,AI 现在已经比绝大部分人更博学、涉猎历史/地理等知识也更全面。Gartner 预计,虽然 AI 的内容生产能力现在占据全网总产出比例不足 1%,但随着时间的推移,在 2025 年内 AI 的内容生产能力占比将攀升 10% 的总产出,人类文明产生的 9 万亿高质量语料数据也会加速被消化完。

对此,周源并不担忧,反而认为 AI 能够帮助社区创作者更好发挥创造力、提高创作效率和质量,从而让更多用户得到帮助、开阔眼界、产生共鸣。“人机共创将帮助知乎更好地实现“让每个人更好的分享知识、经验与见解,找到自己的解答”的愿景;知乎也愿意成为新场景的构建者,构建更高效、更便捷和更好为人服务的场景。”

顺着这个逻辑,ChatGPT 非但不会取代知乎,合理利用反而能提升效率、优化推送精准度——毕竟,技术浪潮总是与时俱进,ChatGPT 也会如过往的技术一样赋能于人,成为人类能力的扩增。

一场“基因重组”的冒险

美团创始人兼 CEO 王兴当年讨论 BAT 竞争关系时说,竞争这个词经常放在一起说就会变成思维定势,“麦克阿瑟将军在西点军校告别演讲说‘Only the dead have seen the end of war’(只有死去的人才能看到战争终结),战斗只是从一个战场变成另一个战场,从一个机会变成另一个机会,总有不断的变化。”

事实上,自 2018 年以后,经常能看到 BAT、TMD 等新老巨头针对业务创新向他人腹地试探的报道,频频短兵相接使得整个互联网商业齿轮推动也陷入一种混战的焦灼状态。

如今,以 GPT-4 为首的多模态大模型俨然 AI 热浪袭来的第二次革命,知乎亦裹挟其中,但相比其他互联网企业而言,知乎推出应用大语言模型的产品天然与生态契合。

一方面,发轫之初的知乎颠覆性构筑出一个基于问答的优质中文社区,网友乐于在知乎上针对具体问题开脑洞或建设性讨论,知乎也能均衡好社区的氛围,从而形成强大的舆论场和群体性意见,这使得知乎几近成为中文互联网公域深度讨论的“濒危物种”——从这个层面看,知乎对公域讨论的重要性被严重低估了。

然而,知乎 2021 年上市以后便大刀阔斧改版步入新业务的验收期,无论好物推荐(卖货)还是在线教育(卖课)、盐选会员(知乎回答里插付费小说)都体现出知乎商业化的决心——当精英底色的内容社区被推至资本市场,大 DAU不够,还要高 ARPU ,知乎管理层的新 KPI 变成增长赚钱两手抓。

结果,社区调性、用户体验与商业化三方平衡并非易事,这个过程中越来越多泛化人群涌入知乎,好处是话语权下移:用户既是内容消费端又是内容生产者;坏处是良莠不齐的新人鱼贯而入,老用户话语权及生存环境受到一定程度挤压。

坦白说,知乎在精英与普惠转型中的拧巴、B 站陷于“二次元”群体的挣扎、快手困于“老铁”基本盘的无奈,很大程度上皆源于产品特性被核心用户标签化,这亦成为它们“长大”必须直面的难题。

况且,知乎作为一个学习型社区而非娱乐平台,本身背离人性舒适惯性,社区用户群体泛化必然会出现“众口难调”的问题,但知乎的问题似乎并不能完全归咎于此——知乎的用户区隔、内容分层及推荐机制已经滞后于平台的扩张和生长速度,两者的错位才是症结所在。

正如李践在《无条件增长》中所阐述的那样:“企业增长有两重概念,一重是外部增长,一重是内部增长。外部增长来自企业外部的边际销售增长,但是外部增长会伴随市场饱和出现天花板,如何实现外部增长扩大其实要依靠内部增长。”

如今看, AI 之于知乎恰恰就是最契合的“内增长”方式之一——在独占赛道前提下,知乎累积数量可观的细分行业知识、精准行业观察,只要有匹配生长速度的技术赋能,用户、内容、商业三个部分互相推动形成正向循环,知乎这个飞轮才能不停地旋转、不断生长壮大。

对此,周源向虎嗅表示,在平衡 AI 与生态关系上,知乎一开始会慎重考虑 AI 逐步加入社区过程中,是否发挥了“赋能”的价值。

“我们必须看到,大语言模型并不是真正的 AGI,它还会经常答错问题。因此,我们第一时间上线了“AI 辅助创作”声明标签,呼吁创作者对自己发布内容的负责。我们始终认为,社区以人为先,每个人也要为自己的身份、关系、创作和互动负责任。同时,我们也开始用大模型识别 AI 生成的劣质内容,帮助提高 AI 时代的社区治理能力。”周源说道。

等于说,Al 对知乎社区治理、商业化提速都会是一场革命式迭代——不过,Al 与社区融合既需要时间沉淀,也需要用户心智建设,外部看变化缓慢,但是内部的生长却快速而复杂,就看知乎是否能抓住这次“换道超车”的时代机遇了。

关键词: