首页 > 业界 > 关键词  > AI推理最新资讯  > 正文

AI日报:全球最快AI推理架构发布;夸克PC端AI全面升级;智谱开源CogVideoX-5B视频生成模型;OpenAI的“草莓”终于熟了

2024-08-28 15:16 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、全球最快AI推理架构Cerebras Inference 速度提升20倍!

Cerebras Systems推出的Cerebras Inference将彻底改变AI推理,提供极低成本下20倍速度,为AI计算树立新标杆。这项开创性解决方案在保持行业领先准确度的同时实现了惊人速度,为AI推理开启新纪元。

image.png

【AiBase提要:】

🌟 速度提升20倍,价格更具竞争力,开启AI推理新纪元。

💡 支持各类AI模型,尤其在大语言模型(LLMs)上表现卓越。

🚀 提供三种服务层次,方便开发者和企业用户灵活选择。

2、Claude超强可视化功能Artifacts向所有用户免费开放

Anthropic的AI初创公司推出了Claude系列大语言模型的新功能“Artifacts”,用户可以轻松生成交互式可视化、图表或小游戏,提升创作效率。功能已在免费、专业和团队版本中开放,支持移动端使用,促进全球创意交流。

image.png

【AiBase提要:】

🔧 Claude Artifacts功能现已在所有用户的免费、专业和团队版本中开放,支持移动端使用。

🌍 只有免费和专业计划的用户能够发布和重制Artifacts,促进全球创意交流。

📊 支持多种输出形式,适用于开发者、产品经理、设计师、营销和销售团队,提升工作效率。

3、AI界的推理大师!OpenAI向联邦调查局展示“草莓”项目,或将在秋季推出

OpenAI向美国国家安全官员展示了草莓项目,承诺在安全、合理范围内开发和使用。草莓将作为聊天机器人的一部分,具有解决数学和编程问题的能力。公司业务增长迅速,估值高达860亿美元。

image.png

【AiBase提要:】

🍓 OpenAI草莓项目将专注解决复杂数学和编程问题。

🚀 公司业务增长迅速,大型语言模型(LLM)和ChatGPT订阅收入同比增长两倍,估值高达860亿美元。

🔍 使用草莓生成的高质量训练数据,有望显著减少AI模型产生的错误。

4、智谱开源CogVideoX-5B视频生成模型老显卡也能带得动

魔搭ModelScope社区近日宣布,其国产开源Sora视频生成模型CogVideoX的更大尺寸版本——CogVideoX-5B已正式开源。新模型在视频生成的质量和视觉效果上都有显著提升,采用了3D因果变分自编码器和专家Transformer技术,结合文本和视频嵌入,使用3D-RoPE作为位置编码,并利用3D全注意力机制进行时空联合建模。模型还采用了渐进式训练技术,能够生成具有显著运动特征、连贯且长时间的高质量视频。

image.png

【AiBase提要:】

✨ 新模型CogVideoX-5B在视频生成质量和视觉效果上有显著提升。

🔍 CogVideoX-5B基于大规模DiT模型,专为文本到视频生成任务设计。

⚙️ 模型采用了3D因果变分自编码器和专家Transformer技术,结合文本和视频嵌入,使用3D-RoPE作为位置编码,并利用3D全注意力机制进行时空联合建模。

详情链接:https://modelscope.cn/models/ZhipuAI/CogVideoX-5b

5、夸克PC端AI全面升级 整合AI搜索、AI创作、AI总结等能力

夸克PC端应用经过全新升级,提升了AI搜索、AI写作、AI PPT、AI文件总结等关键功能。AI搜索功能拥有更强大的模型能力,实现更快的交互速度,领先行业标准。写作方面支持近200种文稿撰写,能快速产出高质量文章。系统级全场景AI能力允许用户通过快捷键调用AI功能,实现搜索、解读、翻译和润色等操作。

image.png

【AiBase提要:】

✨ AI搜索功能升级,交互速度更快,提供精准答案。

📝 支持近200种文稿撰写,半分钟内产出高质量文章。

🔍 系统级全场景AI能力,快捷键调用AI功能实现搜索、解读、翻译和润色。

6、测试期免费试用!元象推出基于物理的3D动作生成模型MotionGen

深圳元象信息科技推出的MotionGen模型是中国3D AIGC领域的重大突破,通过融合大模型、物理仿真和强化学习等算法,实现用户通过简单文本指令快速生成逼真、流畅的3D动作。该模型降低了3D内容制作门槛,提高创作自由度和效率,对动画、游戏、电影和虚拟现实行业具有重要意义。

image.png

【AiBase提要:】

⚙️ MotionGen模型极大降低了3D内容制作门槛,使零经验创作者也能轻松创造高质量动画。

🤖 MotionGen具备精准文本理解能力,支持各类复杂动作创意需求,实现文本到动作的无缝连接。

🌟 MotionGenGPT算法结合多种技术,提升了动作生成的细节表现力和匹配度。

7、智谱AI开放GLM-4-Flash:免费使用、多场景适配

智谱AI开放平台近日宣布GLM-4-Flash模型免费开放,将引领AI应用领域新创新浪潮。该模型高速经济,适用于多种任务,支持多语言,优化了运行效率和降低推理成本。应用广泛且性能出色,已在多领域展现潜力。用户可通过完成调查问卷获得免费微调福利。

【AiBase提要:】

⚙️ GLM-4-Flash模型免费开放,适用于简单任务,多语言支持,优化了运行效率和降低推理成本。

💡 GLM-4-Flash性能出色,生成速度快,具备实时网页检索能力和函数调用能力。

🌐 GLM-4-Flash应用广泛,展现潜力于生物数据处理、训练数据生成、AI助教制作、翻译APP开发等多领域。

详情链接:https://bigmodel.cn/console/trialcenter?modelCode=glm-4-flash

8、Google Meet推出AI自动记笔记功能,会议再也不怕遗漏信息

Google Meet推出了新功能“为我记笔记”,让会议记录变得更便捷高效。这项功能不仅自动总结会议内容,还提供迟到者会议摘要,让大家随时跟上会议进展。同时,会议记录以Google文档形式保存并自动发送给与会者,提供一站式服务。虽然功能强大,但目前仅支持英语,且AI可能出错。预计到2024年9月10日将推广至所有Google Workspace用户。

image.png

【AiBase提要:】

📌 自动总结会议内容,提高会议记录效率。

🕒 提供迟到者会议摘要,帮助快速跟上会议进展。

📄 会议记录以Google文档形式保存并自动发送给与会者,提供便捷服务。

9、AI重塑神话:抖音博主8天打造《山海经》视觉盛宴,网友惊呼超越央视

在中国丰富的文化宝库中,《山海经》无疑是一颗璀璨的明珠。抖音博主AI疯人院借助人工智能技术,用8天时间完成了AI复刻的《山海经》视频,精确还原了原著中的奇幻世界,引发热议并获得观众好评。这种新兴的创作方式展示了AI在视频制作领域的强大潜力,为内容创作带来更多可能性。

image.png

【AiBase提要:】

🌟 抖音博主AI疯人院用人工智能技术重塑《山海经》,精准还原奇幻世界,视频质量令人惊叹。

🔮 视频制作只用了8天时间完成,展示了AI在短剧制作领域的潜力,大大降低了制作成本和周期。

🎮 观众好评如潮,有网友认为视频质量超越央视,展示了《山海经》IP改编成游戏的潜力。

10、AI换脸乱象:特朗普误信AI假图,马斯克被代言诈骗案频发

近日,特朗普转发虚假图片引发泰勒·斯威夫特粉丝抵制,马斯克卷入AI换脸诈骗事件。事件警示投资和信息获取需谨慎,数字时代谨防成为虚假信息受害者。

image.png

【AiBase提要:】

🤖 特朗普转发虚假图片引发泰勒·斯威夫特粉丝抵制。

🔍 马斯克卷入AI换脸诈骗事件,受害者投资数十万美元化为乌有。

😱 AI换脸技术诈骗案件中,马斯克成为最常见代言人之一。

11、谷歌Gemini1.5系列模型发布新版本

谷歌最近推出Gemini1.5系列模型的最新版本,包括Gemini1.5Flash-8B、Gemini1.5Flash和Gemini1.5Pro,性能得到显著提升。开发者们对Gemini1.5Flash的全面性能提升表示狂欢。然而,用户对新模型的反馈呈现两极化趋势,一些期待Gemini2.0的全面升级,另一些赞赏当前更新的速度和性能。

【AiBase提要:】

✨ Gemini1.5系列模型在数学、编程和复杂提示方面有显著提升。

🚀 Gemini1.5Flash能处理超过1000万token的多模态输入,适应能力强。

🛠️ 用户反馈两极化,一些期待Gemini2.0的全面升级,另一些赞赏当前更新。

12、小而美!港大最新推荐系统EasyRec 以文本洞察用户心声

在信息泛滥的时代,推荐系统成为了我们筛选信息的重要助手。EasyRec的出现或许能够解决推荐内容不合口味和精准度不足的难题,其基于语言模型的推荐系统在预测用户喜好方面表现出色。

【AiBase提要:】

🔍 EasyRec是基于语言模型的推荐系统,通过分析文本信息预测用户喜好。

🧠 EasyRec核心技术是文本行为对齐框架,分析用户行为故事来预测潜在喜好。

🚀 EasyRec在多个数据集上测试表现优秀,特别擅长处理新用户和新商品的零样本推荐场景。

详情链接:https://arxiv.org/pdf/2408.08821

13、德勤发布生成式人工智能最新报告

德勤最新报告揭示了企业在生成式人工智能领域的投资情况和挑战。大部分公司正增加对生成式 AI 的投入,但项目仍在试点阶段。企业面临着数据反馈不足、实施障碍等挑战。报告强调企业需清晰展示生成式 AI 的价值以促进持续投资。

【AiBase提要:】

🌟 约66% 的公司增加对生成式 AI 的投资,但大部分项目仍在试点阶段。

💡54% 的企业希望提高效率,但只有38% 在跟踪生产力变化。

📊 企业需向高层清晰展示生成式 AI 的价值,以促进持续投资。

举报

  • 相关推荐
  • AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

    本文介绍了AI日报栏目及近期AI领域多项突破性进展:1)智谱推出免费AI Slides工具,基于GLM模型快速生成高质量PPT;2)可灵AI发布可图2.1模型,支持180多种风格图像生成;3)NVIDIA推出DiffusionRenderer技术,实现视频到可编辑3D场景转换;4)墨刀AI新增30秒生成高保真原型功能;5)Higgsfield推出Soul ID工具,10张照片即可生成虚拟形象;6)谷歌DeepMind开源GenAI Processors工具库;7)谷歌Veo新增图像转视频功能;8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。

  • A日报:B站升级动漫视频生成模型AniSora V3;字节开源4D视频生成框架EX-4D;DeepSWE开源AI Agent系统强势登顶

    AI日报栏目汇总了近期AI领域的重要进展:1)字节跳动开源EX-4D框架,可将单目视频转换为多视角4D视频;2)B站开源动漫视频生成模型AniSora V3,支持多种风格;3)DeepSWE+开源基于Qwen3-32B的AI Agent系统;4)字节开源3亿参数图像编辑模型VINCIE-3B;5)Stability AI推出移动端音频生成模型Stable Audio Open Small;6)谷歌发布免费教育AI工具套件Gemini for Education;7)Topview推出革命性AI数字人带货技术Avatar

  • AI日报:阿里通义开源音频生成模型ThinkSound;谷歌Veo3支态图片生成视频;昆仑万维发布 Skywork-R1V 3.0

    【AI日报】今日AI领域重要动态:1)阿里开源支持链式推理的音频生成模型ThinkSound,实现高保真空间音频生成;2)谷歌Veo3升级,支持静态图片生成生动视频;3)Hugging Face发布30亿参数小模型SmolLM3,性能优于Llama-3.2-3B;4)阿里开源网络智能体WebSailor,展现强大推理和检索能力;5)Moonvalley发布原生1080P视频生成模型Marey Realism v1.5;6)Vidu Q1支持最多七张参考图像生成一致性视频;7)苹果�

  • 谭章熹博士出席 RISC-V 中国峰会 详解开源架构全球征程与中国机遇

    2025年7月16日,第五届RISC-V中国峰会在上海张江科学会堂举行。作为中国大陆规格最高、规模最大的RISC-V专业会展,峰会吸引了全球专家与产业领袖参与。RISC-V国际基金会董事谭章熹博士发表主题演讲,回顾了RISC-V从伯克利起步到全球发展的历程,强调其开源、免费、无专利限制的特性推动了技术创新和生态繁荣。他指出,RISC-V基础指令集仅40余条,结构简洁但高度模块化,适用于从嵌入式设备到高性能计算领域。中国正积极建设RISC-V生态,预计2030年中国高性能RISC-V芯片市场规模将达2000-3000亿元,占全球20%-30%。谭博士表示,RISC-V发展重心正向AI加速、数据中心等高性能场景迈进,将与x86、ARM展开竞争,成为数字时代承载国家技术主权与产业升级的重要基础。

  • A日报:月之暗面开源大模型Kimi K2;智源全面开源RoboBrain2.0;通义千问发布Qwen Chat桌面客户端

    本期AI日报重点报道了多项AI领域突破性进展:1.月之暗面推出万亿参数开源大模型Kimi K2,展现强大智能能力;2.智源研究院开源RoboBrain2.0和RoboOS2.0机器人系统;3.通义千问发布桌面客户端Qwen Chat;4.IndexTTS2实现影视级语音合成;5.HuggingFace开源机器人Reachy Mini热销;6.Meta推出实时视频生成模型StreamDiT;7.PixVerse新增多关键帧视频生成功能;8.特斯拉推出仅支持AMD处理器的Grok AI助手;9.OpenAI推迟开源大模型发布以加强安全测试;10.Liquid AI开源边缘AI模型LFM2;11.AI"时间穿越"特效在社交媒体走红。

  • 云天励飞AI推理芯片亮相联合国舞台,为全球AI普惠贡献中国智慧

    7月10日,云天励飞董事长陈宁博士在联合国"AI for Good"峰会上发表演讲,分享AI推理芯片推动AI普惠的探索成果。他介绍了中国无人机外卖、自动驾驶等AI应用案例,同时指出全球仍面临数字鸿沟问题。陈宁提出AI推理芯片是关键,将其比作"用电"环节,能实现AI能力的大规模落地应用。云天励飞通过创新技术已推出五代NPU产品,并提出"算力积木"架构提升性能。最后,他倡议打造高效AI推理平台、制定统一标准、拓展应用边界,以缩小数字鸿沟,让AI技术惠及全球。

  • AI日报:12306 MCP Server上线;百度推AI搜索助手Tizzy.ai;ChatGPT录音模式面向Plus用户开放

    【AI日报】今日AI领域重要动态:1)百度推出无广告智能搜索助手Tizzy.ai,整合影视资源与深度思考功能;2)12306开源火车票查询引擎上线,采用FastAPI架构实现秒级响应;3)ChatGPT向Plus用户全面开放录音功能,支持实时记录与内容总结;4)开源SaaS模板FireGEO助力快速构建现代化Web应用;5)国产工具ReadMeX可一键生成高质量GitHub文档;6)百度AI助手新增视频通话功能,支持方言识别;7)Jacky

  • 秘塔AI也终于悄悄上线了DeepResearch。

    测试完以后,我觉得这玩意,还是值得我将近通宵写一篇的。 深度研究,也就是DeepResearch。 我过去写过很多次秘塔AI了,因为我自己的搜索习惯,现在基本就是,大活上ChatGPT用DeepResearch,常识问答直接找豆包,一般的AI搜索就是秘塔AI。 当然很多ChatBot产品都有AI搜索,但是我自己这两年,还是习惯用秘塔AI和Perplexity这样形态的原生AI搜索产品了,这可能就是习惯的力量吧。

  • 喜临门发布宝褓·BrainCo 打造全球首款脑机接口AI床垫

    喜临门与强脑科技联合发布全球首款脑机接口AI床垫"宝褓·BrainCo"。该产品通过脑电技术实时监测用户睡眠状态,动态调整助眠参数,形成"床适应人"的主动式睡眠优化系统,显著提升助眠效果与深睡质量。产品搭载云动系统,集成三大功能模块,提供智能唤醒、远程控制等功能。此次合作突破行业技术瓶颈,将睡眠科技从"智能"推向"智慧"层面。618期间喜临门销售额超11亿,同比增长43%,印证市场对其创新技术的认可。未来双方计划联动医疗资源,构建睡眠生态,推动个性化睡眠解决方案落地。

  • 全球优质AI语音大模型盘点:Whisper、Gemini Speech

    本文分析了当前主流AI语音大模型的核心优势与应用场景。全球顶尖模型包括:OpenAI Whisper(多语言识别与翻译)、Google Gemini(情感化语音生成)、Meta AudioCraft(音乐创作与风格转换)。国内讯飞星火(方言识别)、阿里通义(电商客服)、百度文心(车载场景)表现突出。技术突破点在于云端协同架构、零样本克隆和情感语音合成。选择模型需考虑语言支持、场景适配、部署