AI视野：百度Apollo开放平台9.0发布；OpenAI公布ChatGPT安全框架；Etched AI推AI推理加速芯片Sohu；美图云修Pro版正式发布；Runway上线文字生成语音功能

2023-12-19 15:10 · 稿源：站长之家

📰🤖📢AI新鲜事

百度Apollo开放平台9.0发布

百度发布Apollo开放平台9.0，全面升级自动驾驶开发领域，包括工程、算法和工具三方面，重构12万行代码，新增20万行。工程框架拆分成小软件包，提高灵活性;算法优化感知算法，支持4D毫米波雷达;工具升级包括高精地图、传感器标定等，提升Dreamview+效率。

微信截图_20231219135004.png

【AiBase提要:】
🚗 工程框架全面升级，模块拆分提高灵活性;
🔍 算法优化感知算法，支持4D毫米波雷达;
🧰 工具升级包括高精地图、传感器标定，提升效率。

OpenAI公布ChatGPT安全框架

OpenAI发布ChatGPT安全框架，采用风险“记分卡”衡量潜在危害，雇佣跨领域专家团队监测技术，与第三方合作测试技术，与竞争对手Anthropic的政策形成差异。

【AiBase提要:】
🔒 安全框架发布:OpenAI推出ChatGPT安全框架，采用风险“记分卡”评估潜在危害，不断完善框架以确保AI安全。
🌐 跨领域专家团队:雇佣AI研究、国家安全、政策专业人员组成“应对”团队，监测技术风险并提供预警。
🤝 开放合作与竞争对手对比:允许第三方测试技术，与Anthropic的政策形成鲜明对比，展现出框架的灵活性。

Etched AI推AI推理加速芯片Sohu

美国芯片初创公司Etched AI成功开发了一项技术，将Transformer架构直接嵌入芯片，创造出专为Transformer推理的超强服务器Sohu，可运行万亿参数模型，挑战英伟达。

QQ截图20231219095455.jpg

官网地址:https://www.etched.ai/

【AiBase提要】
🔥 Etched AI成功将Transformer架构“烧录”到芯片，创造强大服务器Sohu。
🚀 技术支持实时语音代理、高级解码等多项功能。
💡 服务器配备144GB HBM3E，支持MoE和转换器变体，为高性能提供有力支持。

百度数字人生成专利公布

百度公布一项数字人生成专利，专利涉及人工智能技术领域，通过计算机视觉、自然语言处理和深度学习等技术，实现对数字人赋予不同人格。

【AiBase提要:】
😊 多人格数字人生成专利: 百度公布一项数字人生成专利，通过语言模型训练和三维建模，使数字人具备不同人格。
😃 应用领域广泛: 该专利涉及计算机视觉、自然语言处理和深度学习，可应用于元宇宙等场景，提升数字人的交流与互动自然度。
😎 赋予情感与意识: 生成的数字人可像人类一样表达情感和意识，为人机交互提供更丰富、自然的体验。

OpenAI官方发布Prompt工程指南

OpenAI官方发布的Prompt工程指南分享了六个策略，帮助用户优化ChatGPT等大型语言模型的输出，包括写清楚指令、提供参考文本、拆分复杂任务等。

指南地址:https://platform.openai.com/docs/guides/prompt-engineering

【AiBase提要:】
📌 写清楚指令: 用户需明确、详细指导模型，减少猜测，提高满意度。
📚 提供参考文本: 使用参考文本帮助模型减少错误输出，指导回答问题。
🧩 拆分复杂任务: 将任务分解为简单子任务，降低错误率，提高整体性能。

Adobe终止200亿美元收购Figma

Adobe和Figma宣布终止200亿美元的合并交易，因欧洲监管机构强烈反对，认为该交易将损害竞争，导致用户面临更高的价格和更少的选择。

【AiBase提要:】
💔 Adobe和Figma终止200亿美元的合并交易，欧洲监管机构认为交易将损害竞争，不予批准。
💼 Adobe首席执行官表示尽管相信合并的好处，但由于欧洲监管无法获得批准，共同同意终止交易。
💰 根据合同规定，Adobe需支付Figma10亿美元的终止费，反映科技行业监管日益严格。

Mistral AI CEO宣布于2024年开源GPT-4级别模型

法国初创公司Mistral AI计划于2024年开源GPT-4级别模型，最近获得4.15亿美元融资，推出基于MoE架构的8X7B模型，同时推进多语言模型Mistral Medium的开发。

【AiBase提要:】
🚀 Mistral AI首席执行官Arthur Mensch宣布公司将于2024年开源GPT-4级模型，引起行业广泛关注。
💰 公司最近获得4.15亿美元融资，估值20亿美元，推出基于MoE架构的8X7B模型，同时推出API服务“La Plateforme”。
🌐 Mistral AI正在开发支持多语言的Mistral Medium模型，在标准基准测试中表现优异，预计将于2024年发布。

🤖📱💼AI应用

美图云修Pro版正式发布

美图公司旗下的美图云修正式推出Pro版，搭载全新图像处理引擎，实现实时预览，为商业摄影提供即时修图解决方案。同时，智能修图API服务也正式开放，支持多端应用，助力快速出图。数据显示，美图云修已拥有超过百万用户和3万余家商业摄影机构使用，年修图量超过5亿张，有效提升修图效率和生产力。

微信截图_20231219082230.png

美图云修官网:https://yunxiu.meitu.com/home

【AiBase提要】
🚀 Pro版亮点: 全新图像处理引擎，实时预览，适用于约拍和旅拍等即时修图场景。
💡 API服务开放: 美图云修智能修图API服务全面开放，支持多端应用，实现“即拍即修”。
📈 数据亮点: 超过百万用户、3万余家商业摄影机构使用，年修图量超5亿张，提升修图效率。

Runway上线文字生成语音功能

Runway最近悄悄上线了文字生成语音功能，初次尝试英文效果惊艳，但中文语音仍带有外国口音，可能需要解决。

QQ截图20231218175418.jpg

体验地址:https://app.runwayml.com

【AiBase提要】
🔊 语音功能惊艳登场:Runway最新推出的文字生成语音功能，在英文表达方面展现出惊人的自然丰富情感。
🌐 多模型选择，点数消耗低:该功能提供多种语音模型，仅需右上角点数即可生成长时间可用的语音。
🌐 中文语音仍存问题:尽管英文效果惊艳，中文语音仍存在外国口音问题，可能需要解决。

超强小说生成工具Midreal AI 情节有逻辑还具有互动能力

小说生成工具Midreal AI强于其他LLM直接生成的小说，以内存跨越技术和长篇写作能力为特色，用户可在关键节点选择剧情走向，获得具有逻辑和互动能力的小说。

体验地址:discord.gg/ReKvgchE3P

【AiBase提要:】
🧠 内存跨越技术:Midreal AI采用内存跨越技术，实现几乎无限的记忆保留，确保长期无缝连接的游戏体验。
📝 长篇写作能力:具备长篇写作能力，保持叙事连贯和引人入胜，为用户提供高质量的阅读体验。
🌐 中英文支持:Midreal AI支持中文和英文，为喜爱阅读和写作的用户提供全新的创作体验。

CSM ai推实时草图转3D功能

CSM AI最新推出的实时绘图工具进化，用户可通过简单草图生成3D模型，并导出至3D软件，在儿童游戏和专业3D创意工作中具备广泛应用。

体验地址:https://3d.csm.ai/canvas

【AiBase提要】
🎨 实时草图转3D: CSM AI推出的工具允许用户通过简单的草图实时生成3D模型。
🔄 导出至3D软件: 生成的3D模型可直接导出到其他3D软件中进行进一步编辑和应用。
🌐 免费体验功能: 用户可以通过访问体验地址免费尝试这一功能，为创意设计提供便利。

🤖📈💻💡大模型动态

谷歌推视觉语言模型PixelLLM

通过与加州大学圣迭戈分校合作，谷歌AI研究团队推出PixelLLM，实现了细粒度定位和视觉-语言对齐。该模型通过在语言模型的每个输出单词与像素位置建立密集对齐，成功解决了大语言模型在定位任务中的挑战。

项目体验网址:https://top.aibase.com/tool/pixelllm

论文网址:https://arxiv.org/abs/2312.09237

【AiBase提要:】
🧠 PixelLLM采用密集对齐策略，成功解决了大型语言模型在细粒度定位任务中的挑战。
🌐 在密集目标描述、位置条件描述和引用定位等视觉任务中，PixelLLM表现出卓越性能，取得最先进的结果。
📈 通过引入新的视觉-语言模型，PixelLLM为实现更精确的视觉-语言对齐和定位提供了新的可能性。

元象开源高性能大模型XVERSE-65B-2底座版

元象宣布开源XVERSE-65B-2底座版，强化代码和数学能力，保持生成创作、角色扮演等能力，为生态贡献“文理兼修、大有可为”的大模型。

【AiBase提要:】
🚀 XVERSE-65B-2通过综合优化器状态和学习率策略进行Continual Pre-Training，总训练token量达3.2万亿。
🌐 模型支持40多种语言，上下文窗口为16K，在六个维度11项标准中八成超越GPT3.5。
💡 XVERSE-65B显著提升大模型的理解、生成、逻辑和记忆等能力，是国内最早开源的650亿参数免费商用模型。

项目地址:

Github:https://github.com/xverse-ai/XVERSE-65B
Hugging Face:https://huggingface.co/xverse/XVERSE-65B-2
ModelScope魔搭:https://modelscope.cn/models/xverse/XVERSE-65B-2

UIUC清华联手发布全新代码大模型Magicoder

UIUC和清华合作推出的Magicoder是一款在代码生成领域表现出色的大型语言模型，仅使用了7B参数，并以全面开源的方式分享了其代码、权重和数据。

论文地址:https://arxiv.org/pdf/2312.02120.pdf

【AiBase提要:】
🚀 模型介绍: UIUC和清华合作推出的Magicoder，在代码生成领域以不到7B参数媲美顶级模型，并全面开源其代码、权重和数据。
🛠️ OSS-INSTRUCT方法: Magicoder采用OSS-INSTRUCT方法，从开源代码中获取灵感，生成多样、真实和可控的编码指令数据，注重真实性对于指令调整的重要性。
📈 性能表现: 在Python、其他编程语言以及数据科学库领域，Magicoder表现出色，在DS-1000dataset上改善了8.3个百分点，展现了在实际用例中的潜力。

音乐生成深度学习模型StemGen

字节跳动AI研究团队推出StemGen项目，采用非自回归、基于Transformer的模型，通过听取音乐上下文生成音乐，在音频质量和音乐与上下文协调性方面取得竞争性成果。

项目网址:https://julian-parker.github.io/stemgen/

论文网址:https://arxiv.org/abs/2312.08723

【AiBase提要】
🤖 革新性方法: StemGen采用非自回归、基于Transformer的模型，通过听取音乐上下文生成音乐，突破传统抽象条件的模型。
🌐 模型效果验证: 采用标准指标和主观测试证明StemGen模型在音频质量和音乐与上下文的强大协调性方面表现出竞争性。
🚀 技术进步: 结合图像和语言处理技术，以端到端方式推动深度学习音频生成，提出非自回归、基于Transformer的架构训练模型的新范例。

👨‍💻💡🎯聚焦开发者

创新3D技术Gaussian-SLAM 通过分析视频重建逼真的3D场景

通过分析视频流中的图像，Gaussian-SLAM技术能够实时渲染并重建逼真的3D模型，为自动驾驶、机器人导航、增强现实等领域提供新的可能性。

【AiBase提要:】
🌐 光学真实的渲染: Gaussian-SLAM以高度真实的方式重建和渲染真实世界和合成场景。
🔄 高斯斑点场景表示: 使用高斯斑点作为场景的表示单位，与传统的点云或网格表示不同。
📷 适用于单目RGBD输入: 针对单目RGBD输入数据进行优化，适用于多种场景。

论文地址:https://ivi.fnwi.uva.nl/cv/paper/GaussianSLAM.pdf

项目地址:https://github.com/VladimirYugay/Gaussian-SLAM

演示地址:https://vladimiryugay.github.io/gaussian_slam/

（举报）

相关推荐

关键词：

Apollo

ChatGPT上线图库功能：可管理AI生成图片

快科技4月16日消息，据报道，OpenAI近日宣布将为ChatGPT推出全新的Image Library图库功能，该功能将帮助用户更高效地管理和查看AI生成的图像。这项创新功能将逐步向所有用户开放，包括移动端和网页端的免费版、Plus版及Pro版用户。新功能的设计充分考虑了用户体验的便捷性。用户只需点击ChatGPT侧边栏的Library入口，就能进入一个直观的图像网格界面。在这个界面中，用户可以轻�

OpenAI ChatGPT Image
ChatGPT图像生成爆火！OpenAI CEO在线求助：急需10万块GPU

OpenAI近期推出的全新图像生成工具引发了热潮，用户使用ChatGPT即可创作出吉卜力等风格的AI艺术作品。这一功能不仅推动了ChatGPT用户数的创新高导致服务器负担过重，甚至一度限制了该功能的使用。SensorTower的数据显示，ChatGPT应用的全球下载量和每周活跃用户数分别较上周增长了11%和5%应用内购买收入则增加了6%。

OpenAI ChatGPT 图像生成
IQ 过百的 AI 模型名单发布：ChatGPT、Deepseek等上榜

人工智能IQ哪家强？o3 智商高达 132、Gemini 2.5 Pro Exp. 拿下 128 分、Claude 凭借 3.7 Sonnet Extended 位列第四、Deepsee R 1……

AI智商 ChatGPT Deepseek
ChatGPT受限？这 8 款免费AI工具，也可以生成“吉卜力风格”图片

自从OpenAI将其先进的图像生成器集成到GPT-4o中后，SNS、网络社区等平台上掀起了一股“吉卜力风格头像”风潮。但随着版权争议的加剧，OpenAI给这项“吉卜力风格化”的图像转化功能加了一点点的限制。这款在线工具可以让用户进行编辑、增强、放大图像、将图像转换为视频等多样的操作，只需注册便可使用。

吉卜力风格图像生成版权争议
OpenAI高管计划收购谷歌Chrome：对ChatGPT搜索至关重要

OpenAI高管Nick Turley在谷歌反垄断庭审中透露，若法院裁定谷歌必须出售Chrome浏览器以恢复搜索市场竞争，OpenAI有意收购。庭审揭露OpenAI曾主动寻求与谷歌合作获取搜索技术支持，但遭拒绝。目前ChatGPT仍依赖微软必应搜索技术。Turley承认搜索功能对ChatGPT至关重要，但实现80%查询使用自有搜索技术仍需数年时间。他支持司法部要求谷歌共享搜索数据的提议，认为这将加速ChatGPT技术改进。这场诉讼揭示了AI领域激烈竞争的冰山一角，检方担忧谷歌搜索垄断可能延伸至AI领域。

OpenAI 谷歌反垄断 Chrome浏览器
荐AI日报：ChatGPT重磅上线图像库功能；白嫖！Veo2登陆谷歌AI Studio；蚂蚁百宝箱推“MCP专区”

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、报道称字节跳动整合 AI 研发团队，AI Lab 即将并入 Seed字节跳动正在进行AI研发团队的整合，将独立的字节AI Lab并入Seed团队。这一举措体现了字节在AI领域战略布局的调整，旨在进�

字节跳动 AI研发 AI
ChatGPT图像生成爆火被网友玩坏 OpenAI CEO奥特曼：GPU快要烧了

更新上线仅三天，ChatGPT-4o的图像生成功能，就被网友们玩坏了。ChatGPT-4o的图像生成功能在社交平台上爆红，使用需求远高于预期。GPT-4o还能生成图像中的文字，此前这是图像生成领域的一大难题。

ChatGPT-4o 图像生成 OpenAI
荐OpenAI要Open了，奥特曼开源首个推理模型，ChatGPT一小时暴增百万用户

OpenAI终于要OpenAI了!一大早，奥特曼郑重官宣，「未来几个月，将开源一款强大的推理模型」。这是自GPT-2以来，OpenAI首个开源的模型。无疑为OpenAI下一步增添了更多的戏剧性。

OpenAI 开源模型推理模型
AI日报：即梦3.0内测直出2K商业海报；ChatGPT又更新图片生成功能；饿了么推“AI入驻智能经理”

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。7、Genspark发布自动化AI代理SuperAgent具备自主思考、调用工具的能力Genspark最近推出了其全新的自动化AI代理SuperAgent，凭借其强大的自主思考和任务执行能力，迅速成为行业的焦点。用户只需输入感兴趣的主题，系统便能�

人工智能图像生成 AI产品
有心理问题找 ChatGPT？但研究表明：AI也会变得焦虑……

24岁的大学生A某患有重度抑郁症和恐慌症。由于上学时会突发惊恐发作，因此即使是正常出勤于他言那都很困难，甚至上学期间收到了退学警告。研究团队表示，本次研究“暗示着AI能够在心理健康管理领域发挥重要作用”、“正在探索将AI用作心理健康专家辅助工具的方法，且将重点放在了提高对弱势群体的可及性上”。

心理健康人工智能抑郁症

热文

3 天
7天

AI视野：百度Apollo开放平台9.0发布；OpenAI公布ChatGPT安全框架；Etched AI推AI推理加速芯片Sohu；美图云修Pro版正式发布；Runway上线文字生成语音功能

ChatGPT上线图库功能：可管理AI生成图片

ChatGPT图像生成爆火！OpenAI CEO在线求助：急需10万块GPU

IQ 过百的 AI 模型名单发布：ChatGPT、Deepseek等上榜

ChatGPT受限？这 8 款免费AI工具，也可以生成“吉卜力风格”图片

OpenAI高管计划收购谷歌Chrome：对ChatGPT搜索至关重要

荐AI日报：ChatGPT重磅上线图像库功能；白嫖！Veo2登陆谷歌AI Studio；蚂蚁百宝箱推“MCP专区”

ChatGPT图像生成爆火被网友玩坏 OpenAI CEO奥特曼：GPU快要烧了

荐OpenAI要Open了，奥特曼开源首个推理模型，ChatGPT一小时暴增百万用户

AI日报：即梦3.0内测直出2K商业海报；ChatGPT又更新图片生成功能；饿了么推“AI入驻智能经理”

有心理问题找 ChatGPT？但研究表明：AI也会变得焦虑……

热文

印度将中国电子投资压股至 10%，且要求“技术转让”

“AI教父”杰弗里·辛顿再次发出警告：AI可能正在“失控”！

美国网购市场动荡，希音、Temu 率先在美开启“涨价潮”！

印度将中国电子投资压股至 10%，且要求“技术转让”

“AI教父”杰弗里·辛顿再次发出警告：AI可能正在“失控”！

反垄断案中，谷歌披露 Gemini 月活达3.5亿，日流量为3500万

“你可能患了血癌……” 医生诊断错误，而 ChatGPT 是对的！

Anthropic警告：距离无人干涉的 “AI员工” 时代，只剩一年了！

Meta AI眼镜“实时翻译”功能全面开放，不联网也能用！

郭明錤：iPhone17有望全系配12GB内存！但，有个前提……

4chan 之“死”：互联网最狂野的角落逐渐消逝！

Adobe 发布 Firefly 系列产品，涵盖图片、视频、矢量等

英特尔本周宣布裁员超20%计划，陈立武上任后的首次重大重组

站长商机