AI视野：百度Apollo开放平台9.0发布；OpenAI公布ChatGPT安全框架；Etched AI推AI推理加速芯片Sohu；美图云修Pro版正式发布；Runway上线文字生成语音功能

2023-12-19 15:10 · 稿源：站长之家

📰🤖📢AI新鲜事

百度Apollo开放平台9.0发布

百度发布Apollo开放平台9.0，全面升级自动驾驶开发领域，包括工程、算法和工具三方面，重构12万行代码，新增20万行。工程框架拆分成小软件包，提高灵活性;算法优化感知算法，支持4D毫米波雷达;工具升级包括高精地图、传感器标定等，提升Dreamview+效率。

微信截图_20231219135004.png

【AiBase提要:】
🚗 工程框架全面升级，模块拆分提高灵活性;
🔍 算法优化感知算法，支持4D毫米波雷达;
🧰 工具升级包括高精地图、传感器标定，提升效率。

OpenAI公布ChatGPT安全框架

OpenAI发布ChatGPT安全框架，采用风险“记分卡”衡量潜在危害，雇佣跨领域专家团队监测技术，与第三方合作测试技术，与竞争对手Anthropic的政策形成差异。

【AiBase提要:】
🔒 安全框架发布:OpenAI推出ChatGPT安全框架，采用风险“记分卡”评估潜在危害，不断完善框架以确保AI安全。
🌐 跨领域专家团队:雇佣AI研究、国家安全、政策专业人员组成“应对”团队，监测技术风险并提供预警。
🤝 开放合作与竞争对手对比:允许第三方测试技术，与Anthropic的政策形成鲜明对比，展现出框架的灵活性。

Etched AI推AI推理加速芯片Sohu

美国芯片初创公司Etched AI成功开发了一项技术，将Transformer架构直接嵌入芯片，创造出专为Transformer推理的超强服务器Sohu，可运行万亿参数模型，挑战英伟达。

QQ截图20231219095455.jpg

官网地址:https://www.etched.ai/

【AiBase提要】
🔥 Etched AI成功将Transformer架构“烧录”到芯片，创造强大服务器Sohu。
🚀 技术支持实时语音代理、高级解码等多项功能。
💡 服务器配备144GB HBM3E，支持MoE和转换器变体，为高性能提供有力支持。

百度数字人生成专利公布

百度公布一项数字人生成专利，专利涉及人工智能技术领域，通过计算机视觉、自然语言处理和深度学习等技术，实现对数字人赋予不同人格。

【AiBase提要:】
😊 多人格数字人生成专利: 百度公布一项数字人生成专利，通过语言模型训练和三维建模，使数字人具备不同人格。
😃 应用领域广泛: 该专利涉及计算机视觉、自然语言处理和深度学习，可应用于元宇宙等场景，提升数字人的交流与互动自然度。
😎 赋予情感与意识: 生成的数字人可像人类一样表达情感和意识，为人机交互提供更丰富、自然的体验。

OpenAI官方发布Prompt工程指南

OpenAI官方发布的Prompt工程指南分享了六个策略，帮助用户优化ChatGPT等大型语言模型的输出，包括写清楚指令、提供参考文本、拆分复杂任务等。

指南地址:https://platform.openai.com/docs/guides/prompt-engineering

【AiBase提要:】
📌 写清楚指令: 用户需明确、详细指导模型，减少猜测，提高满意度。
📚 提供参考文本: 使用参考文本帮助模型减少错误输出，指导回答问题。
🧩 拆分复杂任务: 将任务分解为简单子任务，降低错误率，提高整体性能。

Adobe终止200亿美元收购Figma

Adobe和Figma宣布终止200亿美元的合并交易，因欧洲监管机构强烈反对，认为该交易将损害竞争，导致用户面临更高的价格和更少的选择。

【AiBase提要:】
💔 Adobe和Figma终止200亿美元的合并交易，欧洲监管机构认为交易将损害竞争，不予批准。
💼 Adobe首席执行官表示尽管相信合并的好处，但由于欧洲监管无法获得批准，共同同意终止交易。
💰 根据合同规定，Adobe需支付Figma10亿美元的终止费，反映科技行业监管日益严格。

Mistral AI CEO宣布于2024年开源GPT-4级别模型

法国初创公司Mistral AI计划于2024年开源GPT-4级别模型，最近获得4.15亿美元融资，推出基于MoE架构的8X7B模型，同时推进多语言模型Mistral Medium的开发。

【AiBase提要:】
🚀 Mistral AI首席执行官Arthur Mensch宣布公司将于2024年开源GPT-4级模型，引起行业广泛关注。
💰 公司最近获得4.15亿美元融资，估值20亿美元，推出基于MoE架构的8X7B模型，同时推出API服务“La Plateforme”。
🌐 Mistral AI正在开发支持多语言的Mistral Medium模型，在标准基准测试中表现优异，预计将于2024年发布。

🤖📱💼AI应用

美图云修Pro版正式发布

美图公司旗下的美图云修正式推出Pro版，搭载全新图像处理引擎，实现实时预览，为商业摄影提供即时修图解决方案。同时，智能修图API服务也正式开放，支持多端应用，助力快速出图。数据显示，美图云修已拥有超过百万用户和3万余家商业摄影机构使用，年修图量超过5亿张，有效提升修图效率和生产力。

微信截图_20231219082230.png

美图云修官网:https://yunxiu.meitu.com/home

【AiBase提要】
🚀 Pro版亮点: 全新图像处理引擎，实时预览，适用于约拍和旅拍等即时修图场景。
💡 API服务开放: 美图云修智能修图API服务全面开放，支持多端应用，实现“即拍即修”。
📈 数据亮点: 超过百万用户、3万余家商业摄影机构使用，年修图量超5亿张，提升修图效率。

Runway上线文字生成语音功能

Runway最近悄悄上线了文字生成语音功能，初次尝试英文效果惊艳，但中文语音仍带有外国口音，可能需要解决。

QQ截图20231218175418.jpg

体验地址:https://app.runwayml.com

【AiBase提要】
🔊 语音功能惊艳登场:Runway最新推出的文字生成语音功能，在英文表达方面展现出惊人的自然丰富情感。
🌐 多模型选择，点数消耗低:该功能提供多种语音模型，仅需右上角点数即可生成长时间可用的语音。
🌐 中文语音仍存问题:尽管英文效果惊艳，中文语音仍存在外国口音问题，可能需要解决。

超强小说生成工具Midreal AI 情节有逻辑还具有互动能力

小说生成工具Midreal AI强于其他LLM直接生成的小说，以内存跨越技术和长篇写作能力为特色，用户可在关键节点选择剧情走向，获得具有逻辑和互动能力的小说。

体验地址:discord.gg/ReKvgchE3P

【AiBase提要:】
🧠 内存跨越技术:Midreal AI采用内存跨越技术，实现几乎无限的记忆保留，确保长期无缝连接的游戏体验。
📝 长篇写作能力:具备长篇写作能力，保持叙事连贯和引人入胜，为用户提供高质量的阅读体验。
🌐 中英文支持:Midreal AI支持中文和英文，为喜爱阅读和写作的用户提供全新的创作体验。

CSM ai推实时草图转3D功能

CSM AI最新推出的实时绘图工具进化，用户可通过简单草图生成3D模型，并导出至3D软件，在儿童游戏和专业3D创意工作中具备广泛应用。

体验地址:https://3d.csm.ai/canvas

【AiBase提要】
🎨 实时草图转3D: CSM AI推出的工具允许用户通过简单的草图实时生成3D模型。
🔄 导出至3D软件: 生成的3D模型可直接导出到其他3D软件中进行进一步编辑和应用。
🌐 免费体验功能: 用户可以通过访问体验地址免费尝试这一功能，为创意设计提供便利。

🤖📈💻💡大模型动态

谷歌推视觉语言模型PixelLLM

通过与加州大学圣迭戈分校合作，谷歌AI研究团队推出PixelLLM，实现了细粒度定位和视觉-语言对齐。该模型通过在语言模型的每个输出单词与像素位置建立密集对齐，成功解决了大语言模型在定位任务中的挑战。

项目体验网址:https://top.aibase.com/tool/pixelllm

论文网址:https://arxiv.org/abs/2312.09237

【AiBase提要:】
🧠 PixelLLM采用密集对齐策略，成功解决了大型语言模型在细粒度定位任务中的挑战。
🌐 在密集目标描述、位置条件描述和引用定位等视觉任务中，PixelLLM表现出卓越性能，取得最先进的结果。
📈 通过引入新的视觉-语言模型，PixelLLM为实现更精确的视觉-语言对齐和定位提供了新的可能性。

元象开源高性能大模型XVERSE-65B-2底座版

元象宣布开源XVERSE-65B-2底座版，强化代码和数学能力，保持生成创作、角色扮演等能力，为生态贡献“文理兼修、大有可为”的大模型。

【AiBase提要:】
🚀 XVERSE-65B-2通过综合优化器状态和学习率策略进行Continual Pre-Training，总训练token量达3.2万亿。
🌐 模型支持40多种语言，上下文窗口为16K，在六个维度11项标准中八成超越GPT3.5。
💡 XVERSE-65B显著提升大模型的理解、生成、逻辑和记忆等能力，是国内最早开源的650亿参数免费商用模型。

项目地址:

Github:https://github.com/xverse-ai/XVERSE-65B
Hugging Face:https://huggingface.co/xverse/XVERSE-65B-2
ModelScope魔搭:https://modelscope.cn/models/xverse/XVERSE-65B-2

UIUC清华联手发布全新代码大模型Magicoder

UIUC和清华合作推出的Magicoder是一款在代码生成领域表现出色的大型语言模型，仅使用了7B参数，并以全面开源的方式分享了其代码、权重和数据。

论文地址:https://arxiv.org/pdf/2312.02120.pdf

【AiBase提要:】
🚀 模型介绍: UIUC和清华合作推出的Magicoder，在代码生成领域以不到7B参数媲美顶级模型，并全面开源其代码、权重和数据。
🛠️ OSS-INSTRUCT方法: Magicoder采用OSS-INSTRUCT方法，从开源代码中获取灵感，生成多样、真实和可控的编码指令数据，注重真实性对于指令调整的重要性。
📈 性能表现: 在Python、其他编程语言以及数据科学库领域，Magicoder表现出色，在DS-1000dataset上改善了8.3个百分点，展现了在实际用例中的潜力。

音乐生成深度学习模型StemGen

字节跳动AI研究团队推出StemGen项目，采用非自回归、基于Transformer的模型，通过听取音乐上下文生成音乐，在音频质量和音乐与上下文协调性方面取得竞争性成果。

项目网址:https://julian-parker.github.io/stemgen/

论文网址:https://arxiv.org/abs/2312.08723

【AiBase提要】
🤖 革新性方法: StemGen采用非自回归、基于Transformer的模型，通过听取音乐上下文生成音乐，突破传统抽象条件的模型。
🌐 模型效果验证: 采用标准指标和主观测试证明StemGen模型在音频质量和音乐与上下文的强大协调性方面表现出竞争性。
🚀 技术进步: 结合图像和语言处理技术，以端到端方式推动深度学习音频生成，提出非自回归、基于Transformer的架构训练模型的新范例。

👨‍💻💡🎯聚焦开发者

创新3D技术Gaussian-SLAM 通过分析视频重建逼真的3D场景

通过分析视频流中的图像，Gaussian-SLAM技术能够实时渲染并重建逼真的3D模型，为自动驾驶、机器人导航、增强现实等领域提供新的可能性。

【AiBase提要:】
🌐 光学真实的渲染: Gaussian-SLAM以高度真实的方式重建和渲染真实世界和合成场景。
🔄 高斯斑点场景表示: 使用高斯斑点作为场景的表示单位，与传统的点云或网格表示不同。
📷 适用于单目RGBD输入: 针对单目RGBD输入数据进行优化，适用于多种场景。

论文地址:https://ivi.fnwi.uva.nl/cv/paper/GaussianSLAM.pdf

项目地址:https://github.com/VladimirYugay/Gaussian-SLAM

演示地址:https://vladimiryugay.github.io/gaussian_slam/

（举报）

相关推荐
大家在看

关键词：

Apollo

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
荐OpenAI发布全新微调API ：ChatGPT支持更详细可视化微调啦！

4月5日凌晨，OpenAI在官网宣布新增6个全新微调API功能，以扩展自定义模型，帮助企业、开发人员更好地构建特定领域、精细化的ChatGPT应用。这些功能包括:基于Epoch的检查点创建、Playground新功能、第三方集成、全面验证指标、超参数配置和更详细的微调仪表板改进。如果对模型的请求超时或找不到模型名称，可能是因为模型仍在加载中，可在几分钟后重试。

OpenAI OpenAI
微信发布桌面效率AI工具小微助手支持类ChatGPT在线聊天问答功能

微信最近发布了一款名为“小微助手”的桌面AI效率工具，旨在通过自然语言处理技术，提升用户在电脑上的工作效率。这款工具不仅支持Windows和Mac操作系统具备以下特点:搜索功能:小微助手提供了高度灵活的搜索功能，允许用户通过自然语言搜索电脑中指定文件夹的所有内容。对话窗口支持基本编辑操作，并可以独立成为一个单独的窗口，支持会话列表的管理。

小微助手 AI头条
OpenAI允许用户直接使用ChatGPT：无需注册账号

当地时间4月1日，知名人工智能公司OpenAI发布重要公告，宣布将允许用户无需注册即可直接使用ChatGPT，这一举措旨在让更多人能够轻松体验人工智能的魅力。值得注意的是，对于未注册的用户，某些高级功能如保存或分享聊天记录、使用个性化指令等将无法享受。这一举措既体现了OpenAI对于技术进步的追求，也充分尊重了用户的个人意愿和权益。

人工智能 OpenAI ChatGPT
重磅！OpenAI宣布无需注册即可使用ChatGPT

日前，OpenAI宣布放开限制，允许用户无需注册ChatGPT即可直接使用该服务，这将让人们更容易体验人工智能的潜力。OpenAI表示，将从周一开始逐步推出这一功能，让185个国家和地区的超1亿用户使用ChatGPT来学习新事物、寻找创意灵感，并获得问题答案。去年12月，中国工程院等单位发布2023全球十大工程成就，其中就包括ChatGPT，与中国空间站、百亿亿次超级计算机、鸿蒙操作系统等并列。

OpenAI ChatGPT 人工智能
微软发布iPhone可运行的ChatGPT级AI模型Phi-3系列挑战OpenAI地位

微软推出了一款名为Phi-3系列的小型AI模型，该模型在AI领域引起了广泛关注。Phi-3系列中的Phi-3-mini模型，仅拥有3.8B参数，却在多项基准测试中超越了拥有8B参数的Llama3模型。微软的这一举措在开源社区中引起了热烈讨论，许多网友认为这给OpenAI带来了压力，需要OpenAI尽快推出GPT-3.5的后继产品以维持其在AI领域的领先地位。

Phi-3 AI头条
OpenAI新GPT-4 Turbo模型上线：可供付费ChatGPT用户使用

OpenAI的全新GPT-4Turbo模型已全面上线，并正式向付费ChatGPT用户开放。GPT-4Turbo更新标志着人工智能领域的又一重要进步，为用户提供了更强大、更高效的文本处理、数学计算、逻辑推理以及编码能力。GPT-5预计将在今年夏季推出，有望在性能、功能和应用场景等方面实现更大的突破和创新。

OpenAI GPT-4 Turbo
荐奥特曼爆火AI硬件遭差评，ChatGPT版iPhone上市即翻车！

【新智元导读】传说中要取代智能手机的首款AI硬件AiPin，在万众瞩目中面世了!然大家试用后，给出了一边倒的差评:操作复杂学不会，3分钟后过热关机，太慢、太笨、没反应，室外压根看不清……看来，智能手机要被淘汰得再等一阵子。万众瞩目的ChatGPT版iPhone，终于面世了!最近，铺天盖地都是对AiPin的讨论声。但他是绝对不会花700美元购买AiPin的，更不用说每月支付24美元的订阅费，以及T-Mobile的数据服务了。

AI硬件
荐ChatGPT现在能帮你P图了，只需简单说几个字

不论是网页、iOS还是安卓版的ChatGPT，都可以用上DALL-E3强大的编辑图像功能了。OpenAI的DALL-E今天进行了多项升级，在通往Midjourney加Photoshop的道路上又前进了一大步。」现在的ChatGPT，早已不是大语言模型这么简单。

AI ChatGPT DALL-E
荐音乐ChatGPT 2.0来了！AI作曲家被踢馆，亲测周杰伦爆款大翻车

200名音乐人联名信抗议的消息刚出，StabilityAI的新音乐工具就来了!刚刚发布的StableAudio2.0，可以创作长达3分钟的音乐，哼哼几句就能给你创作出一段音乐了!不过广大网友和音乐人试用后表示:有点失望……200多名音乐人联名签公开信抗议Suno的余音还未消，AI音乐又出新工具了——StabilityAI，也下场卷AI音乐了!看来，核心开发人员的出走，并没有减慢它发布产品的�

ChatGPT AI作曲 Stable
Adobe Premiere Pro发布重大更新引入Sora、Runway、Pika等AI视频模型

爆炸级更新!AdobePremierePro正在引入AI工具，以简化视频编辑工作流程并减少完成繁琐任务所需的时间。这些新功能主要由AdobeFirefly视频模型提供支持，预示着视频编辑领域的一次重大变革。这些新功能的引入，无疑将为视频编辑人员带来更多的便利和创新的可能性。

Adobe AI头条

Nextminds:是一家提供在线辅导服务的平台，为所有科目和学术水平的学生提供个性化辅导。

Nextminds是一个提供在线辅导服务的平台，通过与经验丰富的导师在线互动，为学生提供个性化的学习经验。平台提供ICSE、CBSE和州委员会等多种教育体系的辅导。Nextminds的主要优点是学生可以在舒适的家中与专业的导师进行一对一的在线学习，为学生提供高质量的辅导服务。

在线辅导学习个性化

Pedagogue.io:每天花费10分钟，提升您的AI技能。

Pedagogue是一款AI技能培训平台，旨在帮助个人和企业提升AI技能。通过该平台，用户可以学习AI工具、技术和策略，并获得40%的生产力提升。Pedagogue的优势在于更新及时的内容库、个性化的技能培养、有趣的学习方式以及具有商业价值的数据驱动洞察。

AI 技能培训教育

LexiGym:你的语言学习伴侣。🚀 # #HinkouLabs

LexiGym是一款语言学习应用，帮助用户提升语言技能。它具有离线和多语言支持的创新功能，是最强大的语言学习伴侣。用户可以根据自己的预算选择免费使用或付费订阅，灵活选择学习方式。LexiGym还提供易于创建字典和智能学习等功能，以及详细的训练统计数据。

语言学习词汇训练多语言

Alevels.ai:A Levels AI是一个利用人工智能提高A Levels学习成绩的工具。

A Levels AI利用人工智能技术，提供个性化的学习计划和辅导资源，帮助学生在A Levels考试中取得优异成绩。它通过分析学生的学习情况和弱点，为其提供针对性的学习建议和练习题。A Levels AI还提供实时答疑和学习进度跟踪功能，帮助学生更好地掌握知识。

教育考试辅导人工智能

MailReply:是一款AI助手，可生成专业且人性化的邮件回复，节省时间。

MailReply通过AI生成邮件回复，帮助用户节省时间。它可以在保持人类写作风格的同时，根据邮件内容生成上下文相关的回复。MailReply适用于Windows和macOS，并兼容多种邮件客户端。

邮件回复 AI助手工具

Notification harbor:高性能团队的电子邮件营销平台

Notification harbor是一个为电子邮件营销团队提供AI优化的电子邮件内容和自动化流程的平台。通过使用LLM技术，我们可以在短短5分钟内创建高性能的电子邮件营销内容，并且随着时间的推移，产品甚至可以自我优化。我们的平台简化了电子邮件营销活动的方式，确保每个活动都能精准地与您的目标受众建立联系。AI生成的电子邮件模板根据您提供的信息和要求选择最合适的模板。实时个性化电子邮件可以提高用户参与度和转化率，并根据每个用户实时定制内容。AI驱动的电子邮件营销使您的团队在创建电子邮件模板和文本方面节省了60％的时间。

AI视野：百度Apollo开放平台9.0发布；OpenAI公布ChatGPT安全框架；Etched AI推AI推理加速芯片Sohu；美图云修Pro版正式发布；Runway上线文字生成语音功能

今日大家都在搜的词：

热文

站长商机