探寻AI科学本源推动学科从工程化走向科学化 -- 上海热线

消费频道

探寻AI科学本源推动学科从工程化走向科学化

上海热线 2026-04-23 14:58:42

　　4月23日消息：22日，由上海交通大学人工智能学院主办的“Science of AI：人工智能的科学基础研讨会”召开并指出，人工智能应用发展迅速，但科学基础薄弱导致学科发展多次出现大起大落，亟需推动人工智能学科从工程化走向科学化，促使技术从经验试错转向由基本原理指导，期待未来5至10年建立坚实科学基础，实现更高质量发展。

　　上海交通大学副校长蒋兴浩出席活动并表示，人工智能发展既要重视应用实践、释放技术创新价值，更要夯实自身科学体系、筑牢发展根基。

　　中国科学院院士、清华大学计算机科学与技术系教授胡事民在《大模型的评测基准和自主生态》报告中表示，我国大模型研究取得进展，开源领域已领先国际，但多模态推理能力仍有短板。团队研发的“计图”框架速度快、适配国产芯片效率高，可通过元算子机制快速适配芯片、实现生态迁移，提升国产芯片大模型推理性能。团队构建多学科评测基准，发现模型存在多模态能力不足、几何推理受尺度率影响小、模型“偷懒”等问题，并开源多模态数据集与8B参数模型，为国产大模型发展提供基础资源与技术支撑。

　　北京大学智能学院信息科学中心教授王立威以《大模型时代机器学习理论》为题展开分享，认为当前大模型理论研究围绕样本效率、任务泛化、知识学习与发现三大核心方向展开。Transformer结构不使用思维链时，难以一步给出数学题、逻辑推理正确答案，加入思维链后可分步推导、逐词生成答案，固定参数规模也能完成复杂推理，可解决P完全类问题，从理论上解释了思维链的核心价值。

　　上海交通大学人工智能学院教授严骏驰分享大模型优化研究成果JTok模块，针对大模型“堆参数”导致算力、显存成本飙升问题，该模块通过查表和逐元素调制，在不增加主干参数、不稀疏计算路径前提下提升模型容量，可作为插件挂载在Transformer每一层，分静态和动态模式，实现“轻量化扩容”，几乎不增加开销却稳定提升性能，开辟大模型高效Scaling新路径。

　　上海交通大学人工智能学院副教授谢伟迪分享OmniStream 4D流式视觉基础模型，破解视觉领域“一个任务一个模型”的碎片化困境，统一语义、三维空间位置、时间动态三大核心维度，采用因果时序注意力与3D旋转位置编码，经2亿帧全模态数据预训练，在图像语义、视频时序理解上媲美顶尖模型，三维几何、空间问答等领域达到行业领先。

　　上海算法创新研究院研究员杨泓康分享大模型“慢思考”与“主动感知”前沿研究，借鉴第一性原理提出“主动提升”理论，可将复杂数据分布转化为更易建模的隐序列分布，将“慢思考”定义为主动感知的特殊形式，为大模型“慢思考”设计提供完整框架，明确两大核心维度，能推导出最优模型方案，为打造具备深度思考能力的AI提供理论支撑。

　　上海交通大学人工智能学院助理教授夏纫秋分享高可信AI领域研究成果，聚焦自主探索的形式化数学推理，针对大模型数学推理“逻辑黑盒”和“幻觉”瓶颈，利用形式化方法确保推理可验证，通过创新等价性度量标准与层次化推理机制，实现高可靠端到端求解，开发演绎探索智能体，为高可信AI奠定数理底座。

　　随后的“人工智能时代的人才培养”圆桌论坛上，专家普遍认为，AI研究正从“作坊式”向“工业化”转变，需探索校企及国家实验室协同育人模式，平衡科研、教学与创业。风投正向前沿基础领域前置，高校应鼓励学生探索试错、培养冒险精神与跨学科能力，革新课程与论文评价体系，解决真实问题。

　　“Science of AI”圆桌论坛则围绕训练模型参数统计分布、智能与意识涌现机制、物理智能实现、大模型机制可解释性展开交流，大家指出，需发展新理论框架，可能引发物理学基础革新，应结合严谨科学训练，用可控实验、观察现象、提出假设再验证的实证科学方法，构建理解智能的新科学。

　　在中国科学院院士、上海交通大学人工智能学院首席顾问鄂维南看来，人工智能在理论层面已取得巨大进步，相关成果尚未被普遍了解，当前是界定研究方向、组建研究团队的宝贵机会，AI科学事业发展最终必须依靠年轻人，需要年轻人主动作为、引领前行。

阅读全文

声明：本网站所提供的信息仅供参考之用，并不代表本网赞同其观点，也不代表本网对其真实性负责。您若对该稿件内容有任何疑问或质疑，请尽快与上海热线联系，本网将迅速给您回应并做相关处理。联系方式:shzixun@online.sh.cn

探寻AI科学本源 推动学科从工程化走向科学化

探寻AI科学本源推动学科从工程化走向科学化