站长之家(ChinaZ.com)8月9日 消息:据科创板日报消息,中国电信与科大讯飞签署了战略合作协议。
双方此次合作旨在进一步探索5G、人工智能、云计算等新一代信息技术的创新应用与发展。
未来,双方将在多模态大模型、智算网络、云计算、人工智能应用、泛智能终端等领域展开技术研发和业务合作,共同打造具有国际竞争力的重点产品和服务。
(举报)
站长之家(ChinaZ.com)8月9日 消息:据科创板日报消息,中国电信与科大讯飞签署了战略合作协议。
双方此次合作旨在进一步探索5G、人工智能、云计算等新一代信息技术的创新应用与发展。
未来,双方将在多模态大模型、智算网络、云计算、人工智能应用、泛智能终端等领域展开技术研发和业务合作,共同打造具有国际竞争力的重点产品和服务。
(举报)
随着GPT-4的发布,多模态大模型成为热点。业界常将视觉编码器与语言模型集成构建MLLM。模型设计和训练技巧仍需进一步优化,以平衡不同能力之间的权衡。
北京交通大学等机构联合推出了新多模态大模型MMICL。它支持文本、图像、视频三种模态的混合输入,在多项多模态能力评测中表现抢眼。随着其性能和适用场景的不断优化,MMICL有望成为多模态领域的新宠。
随着视觉与语言的深度融合,文本图像理解成为多模态领域的新方向。文章介绍了一个突破性的多模态模型KOSMOS-2.5,它在处理文本密集图像上展现强大能力。目标是进一步提升对文本图像的解释生成能力,将KOSMOS-2.5应用于更多实际场景,如文档处理、信息抽取等,从使语言模型真正具备「读图识文」的能力。
中国电信发布了信息通信领域首个网络大模型——启明,这一创新模型对于提升云网运营效率、开放云网能力以及推动智能化技术应用在各行各业的发展具有重大意义。中国电信副总经理夏冰在会议上强调,大模型是人工智能技术的重要趋势中国电信正积极投身于这一科技革命中,利用其云网融合的优势,推动基础通用大模型向垂直行业大模型的演进,为上层行业应用开发和开源生态提供技术支撑。中国电信自主研发的网络大模型已在企业内部成熟应用,并计划携手产学研合作伙伴,提供多种形式的MaaS服务,以赋能千行百业。
“与历届亚运会相比,杭州亚运会很可能是最智能的一届。”是亚奥理事会代理总干事维诺德在接受媒体访问时的评价。期待这些黑科技产品逐渐渗透到普通用户的生活中,为我们的生活带来更多便利、效率和可持续性。
“大模型”无疑是当前科技互联网领域最受关注的话题。国内外科技企业竞相围绕大模型扩展商业版图,国产大模型进入高速发展期,据不完全统计,目前中国10亿参数规模以上的大模型已发布79个……“百模大战”愈演愈烈。通过实测我们可以看到,在星火大模型的加持下,讯飞智能办公本X3在效率办公方面的能力得到了飞跃式的提升,助力职场商务人士游刃有余地处理工作,让每一位办公人士都能够轻松办公,享受智能办公时代的乐趣。
继各类单一模态输入的多模态语言模型后,新加坡国立大学的华人团队最近开源了全能多模态模型NExT-GPT。该模型支持任意模态的输入和输出,可以实现文本、图像、语音和视频之间的自由转换,是第一个实现从任一模态到任一模态转换的通用多模态系统。后续工作可以考虑扩展更多模态,使用更大规模的语言模型基座,以及改进多模态生成策略等。
继各类输入端多模态大语言模型之后,新加坡国立大学华人团队近期开源一种支持任意模态输入和任意模态输出的真正「大一统」多模态大模型,火爆AI社区。ChatGPT的诞生,引爆了2023年的基于大语言模型的AI浪潮,此后各类开源大语言模型陆续问世,包括Flan-T5、Vicuna、LLaMA、Alpaca等。后续研究可以进一步提升模态切换指令微调学习策略以及数据集。
苹果AI/ML团队与哥伦比亚大学合作研发的多模态大模型“雪貂”已经成功突破了谷歌人机验证码的难题,能够轻松识别图像中的交通信号灯并准确圈出其位置,其性能直逼GPT-4V。Ferret的关键在于改进了大模型在“看说答”任务中的精确度,这得益于其出色的图文关联能力。通过这一研究,Ferret为解决图像理解和多模态任务提供了新的方向,有望在人机交互、智能搜索等领域取得
多模态大模型的战场上,已有人闻到风声。OpenAI的全新多模态模型Gobi似乎已在筹备中。顺便提一句,OpenAI即将在11月召开的首届开发者大会,已经开始注册了,快上手申请吧。