11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
本期AI日报聚焦多项AI技术突破与应用:1)Moonshot AI推出开源音频模型Kimi-Audio,基于13亿小时训练数据,支持语音识别等任务;2)阶跃星辰开源图像编辑模型Step1X-Edit,展现强大生成能力;3)夸克AI上线"拍照问夸克"功能,实现视觉问答;4)苹果iOS18.5将在中国推送,带来智能功能;5)谷歌发布601个生成式AI应用案例,覆盖多行业;6)微软推出深度整合Windows的UFO²自动化系统;7)OpenAI升级ChatGPT至GPT-4o版本,提升STEM领域能力;8)Ema公司推出高性价比语言模型EmaFusion;9)Liquid AI发布面向边缘设备的Hyena Edge模型;10)LemonAI推出实时音视频数字人产品Slice Live。此外,国内方面,智谱与生数科技达成战略合作推动大模型发展,宝马中国宣布新车将接入DeepSeek技术。
Kimi-Audio是一款开源的通用音频基础模型,在语音识别、音频理解、音频转文本、语音对话等任务中表现优异。该模型采用集成式架构设计,包含音频分词器、音频大模型和音频去分词器三大核心组件,支持多模态输入处理。在十余项音频基准测试中,Kimi-Audio均取得领先性能,如LibriSpeech ASR测试WER仅1.28%,VocalSound测试达94.85%。模型使用1300万小时多语言音频数据进行预训练,并构建了自动处理流水线生成高质量训练数据。评估结果显示,Kimi-Audio在语音识别、音乐理解、语音情感分析等任务上全面超越同类模型,在OpenAudioBench和VoiceBench对话测试中也表现最佳。目前模型代码、检查点和评估工具包已在GitHub开源。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、零一万物否认被阿里收购:相关传闻不实北京零一万物科技有限公司针对近期网上关于“阿里收购零一万物”的传闻进行了辟谣。通过技术创新,提升了AI性能,未来将继续探索更多AI应用。
在日前举行的第一届空天信息技术大会上,我国自主研制的百亿级遥感解译基础模型空天灵眸”3.0版正式发布。这是迄今全球首个百亿参数级空天一体遥感解译基础模型。并且已在应急、国土、海洋、住建等多个行业部署试运行,在最具挑战性的复杂要素精细分类、运动小目标连续跟踪等任务上性能卓越。
“这可能是本届WAIC上欢呼声最多的一场发布”在刚刚闭幕的世界人工智能大会上,快手晒出了可灵发布一个月以来的成绩单:“超50万人申请,已开放给超30万用户使用,生成超700万条短视频。”作为全球首个用户可用的真实影像级视频生成大模型,可灵一经问世便引发了强烈反响,连外国网友都纷纷投来了羡慕的目光……甚至StabilityAI的前CEOEmadMostaque看了也表示,中国这次已经
近日,IBM凭借其旗舰Granite系列模型,在2024年第二季度的《ForresterWave:语言AI基础模型》报告中,被评为“强劲表现者”。随着企业从生成式AI的试验阶段转向生产阶段,他们正在寻找基础模型的最佳选择,他们希望这些模型能够提供可信、性能优越且成本效益高的生成式AI。对企业诚信、透明治理、社会责任、包容文化和服务精神的长期承诺是IBM业务发展的基石。
微软近日发布了首个大规模大气基础模型Aurora,这一模型利用人工智能技术,能够预测全球范围内的极端天气事件。与当前数值预报系统相比,Aurora的计算速度提高了约5000倍,拥有超高的准确率和效率。微软发布的Aurora模型的问世标志着AI在天气预测领域的巨大进展,也让人们对未来天气预测的发展充满了期待。
一款名为ambientGPT的开源项目备受关注。这款工具是一款多模态MacOS基础模型操作界面,可以调用GPT-4oAPI或者本地开源模型进行问答,并能直接访问屏幕内容不需要截图。该技术的推出,预示着未来在智能模型应用领域将会迎来更多创新和便利。
百度创始人、董事长兼首席执行官李彦宏在法国巴黎举办的“欧洲科技创新展览会”上表示,中国在人工智能领域与西方的最大区别是应用。中国拥有数百个基础模型,但人们更多关注AI时代的超级应用。尽管技术进步速度并不算快,他仍坚信要抵达理想的AGI时代还需要十年以上。
视觉语言模型屡屡出现新突破,但ViT仍是图像编码器的首选网络结构。字节提出新基础模型——ViTamin,专为视觉语言时代设计。更多大模型算法相关岗位开放中。