当前位置: 锐智首页 > 行业资讯 > 正文

从 DeepSeek,解析 AI 的发展趋势与挑战

时间:2025-05-24 10:13 来源:网络

仅用了短短一个月的时间,一款名DeepSeek 的国产 AI 工具便以“技术奇迹”与“社交狂欢”的双重姿态席卷全球。与以往 AI 给人“远离现生”的印象不同,DeepSeek“无所不能”的神奇特质吸引了各路用户,有人用它炒股、有人用它算命、有人用它做旅行攻略……一时间,“你用 DeepSeek 了吗?”成为线上线下交流的招呼语句。

这款以“低成本高性能”著称的 AI工具好在哪里?该怎么用? AI 又将给普通人的生活带来什么影响?近日,浙江大学滨江研究院数智融合研究中心主任韩蒙研究员向本刊分享了自己的观点和看法。


AI 初步探索阶段标志性事件:1997 年,轰动全球的人机大战中,IBM 公司研制的超级计算机“深蓝”战胜了国际象棋世界冠军卡斯帕罗夫


此次 DeepSeek横空出世,一举搅动了全球大模型市场格局,甚至被誉为“国运级”的创新,该如何理解此次 DeepSeek“出圈”的意义?


韩蒙:首先,我们要建立对 AI 的基本认知。AI 是一门融合了计算机科学、统计学、脑神经学和社会科学的前沿综合性学科。研究 AI 的目标,是希望计算机有像人一样的智力及能力,可以共识性地辅助或者部分替代人类完成感知、认知、推理和决策等多种任务。事实上,早在 20 世纪 50 年代,AI 的概念就已经出现了。1956 年,达特茅斯会议上首次提出了 AI 的概念,被认为是 AI 学科诞生的标志性事件。1997年,轰动全球的人机大战中,IBM公司研制的超级计算机“深蓝”战胜了国际象棋世界冠军卡斯帕罗夫。我们通常认为,这一时间段是 AI从萌芽到初步探索的阶段。

从 20 世纪 90 年代中期到 21 世纪 10 年代,则属于 AI 沉淀积累的阶段。这期间也发生了一系列标志性事件,比如 2012 年 AlexNet 发布,它是第一个在 ImageNet 图像分类竞赛中取得显著优势的深度学习模型,被认为是深度学习图像分类的“开山鼻祖”;2016 年,谷歌 AI 系统 AlphaGo 和世界围棋冠军李世石展开了一场人机智慧的较量,最终 AlphaGo 以 4:1 战胜李世石。

进入 21 世纪 10 年代,随着在技术上取得了一系列的突破,AI 与公众的距离越来越近。比如 2020 年,OpenAI 发布 GPT-3 模型 , 推动了自然语言处理领域的创新;2021 年,TESLA 发布全自动驾驶 beta 版,自动驾驶技术实现实际应 用;2022 年,OpenAI 推 出 ChatGPT推动了全球的大模型浪潮;2023 年,OpenAI 发布 GPT-4,可接收文本和图像输入;2024 年,性能超越 GPT-4 的Claude 3 Opus 大模型发布。还有前段时间,DeepSeek-V3 发布,在知识类任务和数学推理上表现优异;DeepSeek-R1发布,推理能力对标 OpenAI o1,并同步完全开放模型权重。

DeepSeek 之所以引起全球性的关注,与其采用的策略有关。首先是开放开源,其次是公开深度思考的过程,再就是“性价比”高。从时间线可以看出,近几年 AI 领域的颠覆性创新不断涌现,全球围绕 AI 的研发展开了激烈的竞争。一直以来,大模型的研发投入都是以百亿、千亿计的,但 DeepSeek-R1 巧妙地绕过了算力制约,预训练成本不到 GPT-4o 训练成本的十分之一,通过相关架构节省了大量显存,进而实现底层算力的高效利用,以更低的成本训练出更加出色的模型效果。这种扬长避短的技术思路让人们看到,在非常有限的算力资源支持下,通过强大的算法创新,也能突破算力瓶颈,做出具有全球意义的领先成果。


图片

深圳龙岗 AI应用矩阵强势助力政务办公


网友在实际体验DeepSeek 之后,对其褒贬不一,为什么会出现这种现象? DeepSeek 的优势具体在哪方面?


韩蒙:就使用感受来说,有人对 DeepSeek 赞赏有佳,有人反而觉得它没那么好,主要是因为大家对DeepSeek 的期望值与其所展现出来的能力存在差值。

从 AI 出现,人们就对它寄予了厚望。无论是“深蓝”战胜卡斯帕罗夫,还是 AlphaGo 战胜李世石,AI 在人们的期待中带来了很多惊喜。但也要看到,很多时候 AI 的能力离预期还远,技术的演进是随着时间的推移而发生的,不能用 100 分的标准去评判当下 60 分或者 80 分的产品。

这次 DeepSeek 之所以引起震撼,正是源于其发布的拥有 671B 参数的超大规模混合专家模型 (MoE)——DeepSeek V3, 在 MMLU、MMLU-Pro、GPQA 等基准测试中,其性能与 GPT-4o 和 Claude-Sonnet-3.5 等 领 先 的闭源模型相当。现在,很多团队都在利用 DeepSeek V3 开展场景应用,主要是因为 DeepSeek V3 拥有多个非常杰出的技术亮点。

首先它有高效的混合专家架构(Mixture of Experts,MoE), 可以仅使用 37B 的参数激活就能保证模型的性能。这一特性也正是大家所惊叹的。因为通常认为,技术其实很难有绝对的壁垒,时间才是真正的壁垒。而在一个时间点内拥有了超越同行甚至超越国界的技术领先性,就是壁垒;而这个时间的优势又可以将研发力量投入去探索更多价值,这期间所产生的差额也是壁垒。DeepSeek V3 推理速度更快、需要的算力更少,那相应所需要的其他方面的投入就更少,如前所述,在同一时间点上就有了极高的技术优势。另外,DeepSeek V3 作为开源模型,代码和训练方法向全球开放,这样的开放态度也让全球开发者和企业能够以较低的成本使用和改进模型,打破了硅谷公司对高端 AI模型的垄断,加速了 AI 技术的普及和应用,为世界贡献了中国智慧也展现了开放的胸怀。


当前,AI 快速发展的同时也带来了困惑,好像 AI 在各种场景中都能应用,但又好像很多场景不适用。那么 AI 到底可以应用于哪些场景?给普通人的生活会带来哪些影响?又将面对什么样的风险和挑战?


韩蒙:目前在一些非严肃场景,比如娱乐化、市场化的宣传场景中AI 已经得到了广泛使用。而在容错率低、试错成本高的严肃场景能不能使用 AI,成为公众非常关心的问题。而从我们团队的调研情况来看,目前在严肃场景中 AI 也已经可以越来越广泛地发挥作用。

以 DeepSeek 为例,目前各界都在主动接入 DeepSeek,比如三大运营商、深圳的 AI 公务员。它的出现在各行各业中将引爆各式各样的业务,如应用于工业领域中的设计优化、3D 建模、制造检测等环节,医疗领域的药物发现、诊断治疗和关怀陪伴等方向,金融领域的数字员工、投资管理、风险管理等业务,教育领域的课程生成、智能助教等节点,以及电商、传媒、影视、娱乐、游戏等领域,DeepSeek都能为其赋能。

而关于很多人担心的,AI 的发展会不会带来风险。事实上,需要辩证地看待技术带来的机会,以便更好地去把握机会。还是以 DeepSeek 为例,它开启了一个私有化、小型化、边缘化部署的可能性,让原本不能、不敢上传到云端用以进行分析的数据留在了本地进行分析运行,保证了数据的安全。此前出现的深圳 AI 公务员曾让人恐慌,大家担心自己的工作是否会被 AI 所替代。但实际上,当前 AI 承担的是大量繁琐基础且并不一定需要人类来重复操作的劳动,AI 帮助工作人员从这些劳动中解脱出来,从而提升整体工作效率和服务效率。

与此同时,也需要关注到,在实际应用 AI 的过程中,关于数据中毒、模型“幻觉”以及模型自我进化过程中出现偏差等问题也非常需要关注,AI 生成内容的滥用等已经获得了国家的关注,相关的管理制度也在陆续发布。特别是在严肃场景下,如何审慎适时恰当地使用 AI,会变成一个持续且重要的话题。当一个新的技术革命到来时,其实人们往往是避无可避的,在这个视角下,正如人类面对的每一次技术机遇时那样,认知技术、了解技术再努力去驾驭技术为人类所用才是我们为数不多的理性选择。