4月23日消息:22日,由上海交通大学人工智能学院主办的“Science of AI:人工智能的科学基础研讨会”召开并指出,人工智能应用发展迅速,但科学基础薄弱导致学科发展多次出现大起大落,亟需推动人工智能学科从工程化走向科学化,促使技术从经验试错转向由基本原理指导,期待未来5至10年建立坚实科学基础,实现更高质量发展。
上海交通大学副校长蒋兴浩出席活动并表示,人工智能发展既要重视应用实践、释放技术创新价值,更要夯实自身科学体系、筑牢发展根基。
中国科学院院士、清华大学计算机科学与技术系教授胡事民在《大模型的评测基准和自主生态》报告中表示,我国大模型研究取得进展,开源领域已领先国际,但多模态推理能力仍有短板。团队研发的“计图”框架速度快、适配国产芯片效率高,可通过元算子机制快速适配芯片、实现生态迁移,提升国产芯片大模型推理性能。团队构建多学科评测基准,发现模型存在多模态能力不足、几何推理受尺度率影响小、模型“偷懒”等问题,并开源多模态数据集与8B参数模型,为国产大模型发展提供基础资源与技术支撑。
北京大学智能学院信息科学中心教授王立威以《大模型时代机器学习理论》为题展开分享,认为当前大模型理论研究围绕样本效率、任务泛化、知识学习与发现三大核心方向展开。Transformer结构不使用思维链时,难以一步给出数学题、逻辑推理正确答案,加入思维链后可分步推导、逐词生成答案,固定参数规模也能完成复杂推理,可解决P完全类问题,从理论上解释了思维链的核心价值。
上海交通大学人工智能学院教授严骏驰分享大模型优化研究成果JTok模块,针对大模型“堆参数”导致算力、显存成本飙升问题,该模块通过查表和逐元素调制,在不增加主干参数、不稀疏计算路径前提下提升模型容量,可作为插件挂载在Transformer每一层,分静态和动态模式,实现“轻量化扩容”,几乎不增加开销却稳定提升性能,开辟大模型高效Scaling新路径。
上海交通大学人工智能学院副教授谢伟迪分享OmniStream 4D流式视觉基础模型,破解视觉领域“一个任务一个模型”的碎片化困境,统一语义、三维空间位置、时间动态三大核心维度,采用因果时序注意力与3D旋转位置编码,经2亿帧全模态数据预训练,在图像语义、视频时序理解上媲美顶尖模型,三维几何、空间问答等领域达到行业领先。
上海算法创新研究院研究员杨泓康分享大模型“慢思考”与“主动感知”前沿研究,借鉴第一性原理提出“主动提升”理论,可将复杂数据分布转化为更易建模的隐序列分布,将“慢思考”定义为主动感知的特殊形式,为大模型“慢思考”设计提供完整框架,明确两大核心维度,能推导出最优模型方案,为打造具备深度思考能力的AI提供理论支撑。
上海交通大学人工智能学院助理教授夏纫秋分享高可信AI领域研究成果,聚焦自主探索的形式化数学推理,针对大模型数学推理“逻辑黑盒”和“幻觉”瓶颈,利用形式化方法确保推理可验证,通过创新等价性度量标准与层次化推理机制,实现高可靠端到端求解,开发演绎探索智能体,为高可信AI奠定数理底座。
随后的“人工智能时代的人才培养”圆桌论坛上,专家普遍认为,AI研究正从“作坊式”向“工业化”转变,需探索校企及国家实验室协同育人模式,平衡科研、教学与创业。风投正向前沿基础领域前置,高校应鼓励学生探索试错、培养冒险精神与跨学科能力,革新课程与论文评价体系,解决真实问题。
“Science of AI”圆桌论坛则围绕训练模型参数统计分布、智能与意识涌现机制、物理智能实现、大模型机制可解释性展开交流,大家指出,需发展新理论框架,可能引发物理学基础革新,应结合严谨科学训练,用可控实验、观察现象、提出假设再验证的实证科学方法,构建理解智能的新科学。
在中国科学院院士、上海交通大学人工智能学院首席顾问鄂维南看来,人工智能在理论层面已取得巨大进步,相关成果尚未被普遍了解,当前是界定研究方向、组建研究团队的宝贵机会,AI科学事业发展最终必须依靠年轻人,需要年轻人主动作为、引领前行。
