基础模型

本期AI日报聚焦多项AI技术突破与应用：1)Moonshot AI推出开源音频模型Kimi-Audio，基于13亿小时训练数据，支持语音识别等任务；2)阶跃星辰开源图像编辑模型Step1X-Edit，展现强大生成能力；3)夸克AI上线"拍照问夸克"功能，实现视觉问答；4)苹果iOS18.5将在中国推送，带来智能功能；5)谷歌发布601个生成式AI应用案例，覆盖多行业；6)微软推出深度整合Windows的UFO²自动化系统；7)OpenAI升级ChatGPT至GPT-4o版本，提升STEM领域能力；8)Ema公司推出高性价比语言模型EmaFusion；9)Liquid AI发布面向边缘设备的Hyena Edge模型；10)LemonAI推出实时音视频数字人产品Slice Live。此外，国内方面，智谱与生数科技达成战略合作推动大模型发展，宝马中国宣布新车将接入DeepSeek技术。...

特别声明：本页面标签名称与页面内容，系网站系统为资讯内容分类自动生成，仅提供资讯内容索引使用，旨在方便用户索引相关资讯报道。如标签名称涉及商标信息，请访问商标品牌官方了解详情，请勿以本站标签页面内容为参考信息，本站与可能出现的商标名称信息不存在任何关联关系，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述反馈文件后，将会依法依规核实信息，第一时间沟通删除相关内容或断开相关链接。

与“基础模型”的相关热搜词：

相关“基础模型” 的资讯48篇

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
荐 AI日报：Kimi全新音频基础模型Kimi-Audio；阶跃星辰开源图像编辑模型Step1X-Edit；夸克AI超级框上线 “拍照问夸克”

本期AI日报聚焦多项AI技术突破与应用：1)Moonshot AI推出开源音频模型Kimi-Audio，基于13亿小时训练数据，支持语音识别等任务；2)阶跃星辰开源图像编辑模型Step1X-Edit，展现强大生成能力；3)夸克AI上线"拍照问夸克"功能，实现视觉问答；4)苹果iOS18.5将在中国推送，带来智能功能；5)谷歌发布601个生成式AI应用案例，覆盖多行业；6)微软推出深度整合Windows的UFO²自动化系统；7)OpenAI升级ChatGPT至GPT-4o版本，提升STEM领域能力；8)Ema公司推出高性价比语言模型EmaFusion；9)Liquid AI发布面向边缘设备的Hyena Edge模型；10)LemonAI推出实时音视频数字人产品Slice Live。此外，国内方面，智谱与生数科技达成战略合作推动大模型发展，宝马中国宣布新车将接入DeepSeek技术。

AI日报音频技术开源模型
荐秒杀同行！Kimi开源全新音频基础模型，横扫十多项基准测试，总体性能第一

Kimi-Audio是一款开源的通用音频基础模型，在语音识别、音频理解、音频转文本、语音对话等任务中表现优异。该模型采用集成式架构设计，包含音频分词器、音频大模型和音频去分词器三大核心组件，支持多模态输入处理。在十余项音频基准测试中，Kimi-Audio均取得领先性能，如LibriSpeech ASR测试WER仅1.28%，VocalSound测试达94.85%。模型使用1300万小时多语言音频数据进行预训练，并构建了自动处理流水线生成高质量训练数据。评估结果显示，Kimi-Audio在语音识别、音乐理解、语音情感分析等任务上全面超越同类模型，在OpenAudioBench和VoiceBench对话测试中也表现最佳。目前模型代码、检查点和评估工具包已在GitHub开源。

音频模型语音识别开源项目
荐 AI日报：零一万物否认被阿里收购；ChatGPT Pro订阅仍亏钱；英伟达首个世界基础模型Cosmos

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、零一万物否认被阿里收购:相关传闻不实北京零一万物科技有限公司针对近期网上关于“阿里收购零一万物”的传闻进行了辟谣。通过技术创新，提升了AI性能，未来将继续探索更多AI应用。

人工智能技术趋势 AI产品应用
自主研制！我国发布全球首个百亿级遥感解译基础模型

在日前举行的第一届空天信息技术大会上，我国自主研制的百亿级遥感解译基础模型空天灵眸”3.0版正式发布。这是迄今全球首个百亿参数级空天一体遥感解译基础模型。并且已在应急、国土、海洋、住建等多个行业部署试运行，在最具挑战性的复杂要素精细分类、运动小目标连续跟踪等任务上性能卓越。

空天灵眸3.0 遥感解译模型百亿参数模型
荐千呼万唤的可灵网页版来了！基础模型重磅升级，新功能“炸场”WAIC

“这可能是本届WAIC上欢呼声最多的一场发布”在刚刚闭幕的世界人工智能大会上，快手晒出了可灵发布一个月以来的成绩单:“超50万人申请，已开放给超30万用户使用，生成超700万条短视频。”作为全球首个用户可用的真实影像级视频生成大模型，可灵一经问世便引发了强烈反响，连外国网友都纷纷投来了羡慕的目光……甚至StabilityAI的前CEOEmadMostaque看了也表示，中国这次已经

可灵可灵网页版
IBM凭借Granite，被Forrester评为语言AI基础模型的“强劲表现者”

近日，IBM凭借其旗舰Granite系列模型，在2024年第二季度的《ForresterWave:语言AI基础模型》报告中，被评为“强劲表现者”。随着企业从生成式AI的试验阶段转向生产阶段，他们正在寻找基础模型的最佳选择，他们希望这些模型能够提供可信、性能优越且成本效益高的生成式AI。对企业诚信、透明治理、社会责任、包容文化和服务精神的长期承诺是IBM业务发展的基石。

IBM Granite Forrester
微软发布大规模大气基础模型Aurora，用AI预测全球极端天气

微软近日发布了首个大规模大气基础模型Aurora，这一模型利用人工智能技术，能够预测全球范围内的极端天气事件。与当前数值预报系统相比，Aurora的计算速度提高了约5000倍，拥有超高的准确率和效率。微软发布的Aurora模型的问世标志着AI在天气预测领域的巨大进展，也让人们对未来天气预测的发展充满了期待。

Aurora AI AI头条
ambientGPT：开源多模态MacOS基础模型操作界面可调用GPT-4o API

一款名为ambientGPT的开源项目备受关注。这款工具是一款多模态MacOS基础模型操作界面，可以调用GPT-4oAPI或者本地开源模型进行问答，并能直接访问屏幕内容不需要截图。该技术的推出，预示着未来在智能模型应用领域将会迎来更多创新和便利。

ambientGPT GPT-4o AI头条
李彦宏：AI应用可以推动基础模型创新促进数据生成

百度创始人、董事长兼首席执行官李彦宏在法国巴黎举办的“欧洲科技创新展览会”上表示，中国在人工智能领域与西方的最大区别是应用。中国拥有数百个基础模型，但人们更多关注AI时代的超级应用。尽管技术进步速度并不算快，他仍坚信要抵达理想的AGI时代还需要十年以上。

人工智能应用驱动超级应用
荐字节发布视觉基础模型ViTamin，多项任务实现SOTA，入选CVPR2024

视觉语言模型屡屡出现新突破，但ViT仍是图像编码器的首选网络结构。字节提出新基础模型——ViTamin，专为视觉语言时代设计。更多大模型算法相关岗位开放中。

字节

热文

3 天
7天

基础模型

与“基础模型”的相关热搜词：

相关“基础模型” 的资讯48篇

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

荐 AI日报：Kimi全新音频基础模型Kimi-Audio；阶跃星辰开源图像编辑模型Step1X-Edit；夸克AI超级框上线 “拍照问夸克”

荐秒杀同行！Kimi开源全新音频基础模型，横扫十多项基准测试，总体性能第一

荐 AI日报：零一万物否认被阿里收购；ChatGPT Pro订阅仍亏钱；英伟达首个世界基础模型Cosmos

自主研制！我国发布全球首个百亿级遥感解译基础模型

荐千呼万唤的可灵网页版来了！基础模型重磅升级，新功能“炸场”WAIC

IBM凭借Granite，被Forrester评为语言AI基础模型的“强劲表现者”

微软发布大规模大气基础模型Aurora，用AI预测全球极端天气

ambientGPT：开源多模态MacOS基础模型操作界面可调用GPT-4o API

李彦宏：AI应用可以推动基础模型创新促进数据生成

荐字节发布视觉基础模型ViTamin，多项任务实现SOTA，入选CVPR2024

热文

“AI教父”杰弗里·辛顿再次发出警告：AI可能正在“失控”！

印度将中国电子投资压股至 10%，且要求“技术转让”

美国网购市场动荡，希音、Temu 率先在美开启“涨价潮”！

反垄断案中，谷歌披露 Gemini 月活达3.5亿，日流量为3500万

Anthropic警告：距离无人干涉的 “AI员工” 时代，只剩一年了！

“你可能患了血癌……” 医生诊断错误，而 ChatGPT 是对的！

Meta AI眼镜“实时翻译”功能全面开放，不联网也能用！

“AI教父”杰弗里·辛顿再次发出警告：AI可能正在“失控”！

郭明錤：iPhone17有望全系配12GB内存！但，有个前提……

4chan 之“死”：互联网最狂野的角落逐渐消逝！

Adobe 发布 Firefly 系列产品，涵盖图片、视频、矢量等

印度将中国电子投资压股至 10%，且要求“技术转让”

英特尔本周宣布裁员超20%计划，陈立武上任后的首次重大重组

站长商机