首页 > 传媒 > 关键词  > 正文

RockAI参与上海市政协重点课题调研,共话大模型技术发展与实践革新

2024-04-22 14:51 · 稿源: 站长之家用户

4月18日,上海市政协经济和金融委员会开展“加快新旧动能转换,推动制造业高质量发展”重点课题调研,围绕人工智能产业邀请相关部门和企业座谈交流。岩山科技旗下上海岩芯数智(以下简称“RockAI”)以其在人工智能技术领域的深厚积累和创新能力,受邀参与此次座谈,共话大模型产业发展新趋势。

本次座谈会由市政协经济和金融委员会主任严旭主持,特别邀请市政协副主席肖贵玉、寿子琪参与,徐汇区委书记曹立强陪同调研。座谈会上,市领导就“通用人工智能大模型国内外企业差距”的话题询问企业的发展意见。部分企业认为,国内人工智能大模型已经从去年的“百模大战”进入“淘汰赛”阶段,当前大模型企业发展的痛点主要是算力和人才。作为以认知智能为基础、专注于自然语言理解及人机交互等核心技术的创新型企业,岩芯数智代表行业前沿,积极参与并贡献了专业见解。

RockAI企业代表邹佳思认为,虽然在短期内算力和人才是推动大模型发展的关键要素,但从长远看,底层技术的创新可能才是关键所在。以GPT4大参数大算力的相关数据为例,GPT4由16个1100亿的模型通过MOE架构组成,经过百天在两万张卡上完成训练,耗电量巨大,应验了算力的尽头是电力。而GPT5拥有更大的参数、更大的数据,需要更多的GPU算力,这些要素都是目前国内大模型企业面临的困难。另一方面,目前主流基于Transformer架构的模型有着与生俱来的幻觉问题,在个人场景也许是创造力的表现,但是跟很多企业落地场景是有天然冲突的。

提及“GPT5会给国内大模型企业带来哪些挑战”,邹佳思表示,虽然主流架构的Scaling Law依然生效且没到天 花板,但是我们也注意到Transformer架构跟人脑的工作模式是不一致的,人的大脑有800-1000亿神经元,不但可以局部激活而且能工作在20瓦的低功率之下。国内一方面固然需要沿着OpenAI路线进行追赶,但是换个角度,底层架构的创新以及针对企业场景的模型创新或许是新的机遇。

据悉,通过持续加强核心算法自研和技术探索,RockAI已从零开始完全自主研发设计了Yan架构,并于2024年1月发布了国内首 个非Attention机制的通用大模型——“Yan1.0模型”。该创新架构重点关注大模型算力和幻觉问题,可助力大模型在金融、能源、制造、医疗等风险敏感领域实现广泛应用,提供性价比更高、更便捷、更可控的AI服务。目前,RockAI已与上海工创中心、华为昇腾、广电五舟等科技企业达成战略合作,接下来将携手生态伙伴进一步推动创新升级和生态建设。

“我们现在要做的是种一个种子下去,让这个种子具有良好的基因,发育成一个胚胎,最后形成一个巨人。”市政协副主席肖贵玉说,人工智能背后有巨大的想象空间,而大模型正引领新一轮人工智能变革,已经成为全球科技竞争的焦点。他希望各位企业家脚踏实地为“打造基因”献计献策。针对现有教育难以支撑先导产业和未来产业发展的局面,他表示,要在机制层面解决人才问题:在教育端创新改革,连接高校和企业的合作渠道,达到依靠自身的教育体系为企业提供高端人才人力资源支撑的目的。

“上海要打造AI高地,重点在落地应用,赋能各行各业解决各类问题。”座谈会进入尾声,市政协副主席寿子琪总结到,希望能聚焦“基础大模型怎么做”“架构上如何寻找更优解”“是否能打造本地人工智能企业”等展开调研,争取率先在具体领域应用取得突破,对上海推进人工智能产业发展意义重大。

此次座谈会为RockAI提供了与政府部门、专家学者以及行业同仁深度对话的平台,进一步促进了产学研合作,强化了企业在人工智能领域的发展共识。RockAI期待与各方携手,共同推动上海乃至全国人工智能产业迈向更高水平,为我国经济“数实融合”与持续健康发展添砖加瓦。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 算力赋能营销革新,东信云与华为云签约共建多模态大模型应用标杆

    6月21日,东信云与华为云在HDC2025大会上签署合作协议,双方将基于昇腾AI云服务深化合作,重点布局多模态大模型应用与数字人技术。合作内容包括:1)构建智能营销系统,整合文本、图像、视频等多元数据,提升市场分析和消费者行为预测能力;2)通过大模型实现营销内容自动化生成,包括新闻稿、社交媒体帖子和广告文案;3)优化大模型架构,提升训练和推理效率。东信云6月发布的"数字人智能引擎"已实现分钟级生成逼真数字人,显著提升推荐转化率。双方还将联合行业伙伴共建营销大模型生态系统,推动营销行业智能化升级。

  • Meta整合AI团队实力跃升,OpenAI/微美全息多维技术发展锚定前沿未来

    Meta在AI领域面临激烈竞争,正重组团队加速产品开发。其AI部门将分为产品团队和AGI基础部门,同时保持FAIR研究部门的独立性。OpenAI以65亿美元收购Jony Ive创立的设备公司,计划开发"物理AI"设备。Anthropic发布新一代AI模型Claude Opus4和Sonnet4,在基准测试中击败OpenAI和谷歌。微美全息(WIMI.US)布局AI大模型、人形机器人、AR/VR等多个前沿领域,推动AI从技术突破向价值创造跃迁。全球AI竞争白热化,模型加速融入千行百业,开源整合成为新焦点。

  • 行业首个!海尔智家ESG实践成复旦MBA研究课题

    6月17日,复旦MBA iLab项目举行终期汇报,28个项目涵盖科创管理、ESG等四大领域。海尔智家作为家电行业首个入选案例,其ESG实践获师生高度评价。海尔通过绿色产品创新、全球公益联动和投资者沟通等举措,连续四年稳居《财富》中国ESG影响力行业榜首。未来,海尔将持续深化ESG战略,推动行业可持续发展。

  • 预测大模型的工业生存法则,华为博士告诉你什么才是B端最需要的大模型!

    华为开发者大会2025期间,AI专家李良基与华为团队围绕预测大模型展开深度对话。华为提出"数据原子级表征体系"理念,旨在通过统一数据编码解决跨场景迁移难题。预测大模型已在钢铁行业成功应用,温度预测准确率远超传统方案。专家指出,AGI发展的核心在于构建知识迁移能力,未来将聚焦To B场景落地,通过统一架构实现跨领域泛化应用。华为云首创Triplet Transformer

  • StarRocks 优化实践:揭秘毫秒级实时分析的三大核心技术

    StarRocks是一款高性能实时分析数据库,通过三大核心技术解决海量数据分析难题:1)向量化执行引擎,采用批处理方式减少CPU开销,支持SIMD指令集加速计算;2)CBO优化器,基于统计信息智能选择最优执行计划,支持复杂查询改写和物化视图优化;3)列式存储结构,结合稀疏索引和Bitmap索引提升I/O效率。其企业级产品镜舟数据库在此基础上增强多租户隔离、RBAC权限控制等特性

  • 中文大模型忠实性幻觉评测:豆包大模型幻觉率仅4%,位居全球收之首

    SuperCLUE+最新评测显示,豆包大模型1.5Pro以仅4%的幻觉率和96%的准确率位居全球榜首,超越DeepSeek、Gemini-2.5-pro和GPT-4o等主流模型。该模型在文本摘要、多文本问答等关键任务中表现优异,尤其在中文理解任务上国内领先。基于MoE架构设计,其综合性能超过多款超大规模预训练模型,推理成本显著降低。截至2025年3月,豆包大模型日均调用量达12.7万亿tokens,是一年前的106倍。IDC报告指出火山引擎以46.4%市场份额领跑中国公有云大模型市场。据悉,6月11日将发布豆包大模型最新升级进展。

  • 《卓世科技MCP 技术融合实践白皮书》发布

    本文介绍了AI应用开发中MCP(模型上下文协议)的重要作用。MCP作为标准化AI工具交互协议,允许AI代理根据任务上下文自主发现、选择和编排工具,突破传统预定义工具映射的局限。文章重点展示了卓世科技在医疗健康领域的创新实践:通过MCP整合多源异构医疗知识图谱,构建全栈式健康监测网络,实现诊疗规范、药品信息等动态同步;同时开发智能周报系统,实现多模态内容自动生成与精准推送。MCP架构采用客户端-服务器模式,支持本地高效通信与云端实时交互,为AI应用提供灵活性和互操作性。未来,MCP将与A2A协议互补协作,推动AI从单点工具向系统化智能协同演进。

  • 智能体时代,还得看豆包大模型

    火山引擎,又有大动作了。 2025年6月11日,火山引擎Force原动力大会发布豆包大模型1.6、视频生成模型Seedance1.0pro等重磅新模型,以及迭代了一站式AI云原生全栈服务。 对此,字节跳动CEO梁汝波表示:“做好火山引擎对字节跳动成为一家优秀的科技公司、保持技术竞争力很重要。未来,字节跳动会坚定长期投入,追求智能突破,服务产业应用。通过火山引擎,持续把新模型、新�

  • 一场文心大模型的「AI马拉松」

    对于百度而言,既要保持长期主义的战略定力,也要在技术路径上灵活应变,这种「变与不变」的平衡或许正是其在这轮科技革命中的制胜之道。 2025年,模型能力的重要性依然无需多言。 从预训练的角度来看,虽然连 OpenAI 前首席科学家 Ilya Sutskever 都说,预训练数据即将用尽,但海量的图像、视频等多模态数据资源依然有待挖掘。 从后训练的角度来看,强化学习新范式正�

  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。