AI视野：腾讯云AI绘画上线SaaS版本；ChatGPT将推新功能Sunshine;SOLAR10.7B大模型屠榜；LG发布全新AI笔记本；麻省理工开源Stream Diffusion

2023-12-29 14:49 · 稿源：站长之家

新鲜AI产品点击了解:https://top.aibase.com/

🤖📱💼AI应用

ChatGPT将推新功能Sunshine

OpenAI计划推出名为“Project Sunshine”的ChatGPT个性化升级，包括更连贯的对话、改进学习能力和自定义记忆功能，以及2024年推出GPT商店升级。

【AiBase提要:】
💬 OpenAI计划推出ChatGPT升级功能“Project Sunshine”，提供更个性化的对话体验和自定义记忆功能。
🔄 升级计划延期至2024年，新增GPT商店搜索功能，展示最优秀的GPT定制应用平台。
🌐 新功能将使ChatGPT更加智能、个性化，为用户提供更高质量的回答和工作助理服务。

腾讯云AI绘画上线SaaS版本

腾讯云AI绘画推出SaaS版本，成为国内首批通过中国信通院评估的AIGC绘画平台，提供API和在线工具，支持智能图生成、文生成图等多种能力。

【AiBase提要:】
🚀腾讯云AI绘画推出SaaS版本和API两种产品形态，满足不同场景需求，支持智能图生成、文生成图等多项能力。
🌐在中文语境下进行专门优化，展现对中文的深理解和对东方审美的偏好，速度出色，API接口响应时间仅为业内平均水平的一半。
🎨提供在线工具，包括文生成图和图生成图等功能，同时具备作品管理、批量生成和下载等功能，为创意专业人士提供便利。

AI生成视频工具Assistive Video 输入描述即可生成视频

Assistive Video是一款人工智能生成视频工具，用户通过输入描述或上传图片即可轻松生成高质量4秒视频，为各领域带来便捷的视频制作体验。

体验地址:https://top.aibase.com/tool/assistive-video

【AiBase提要:】
🎥 视频生成便捷:Assistive Video通过输入描述或图片，快速生成高清视频，让用户无需专业技能即可轻松创作各类型视频。
🌐 广泛应用领域:该工具有望在广告、影视后期制作、社交媒体内容创作等领域发挥作用，为行业带来革命性改变。
🚀 个性化设置:用户可控制视频质量、一致性、运动强度，甚至设置种子，满足个性化需求，提升用户体验。

Spiritme AI:手机拍5分钟视频即可克隆一个虚拟的你

Spiritme AI是一款类似Heygen的工具，通过使用iPhone拍摄5分钟视频，能够捕捉用户的外貌、动作和表情，实现虚拟形象的克隆，同时支持将文本转换成虚拟形象演说视频。

体验地址:https://top.aibase.com/tool/spiritme-ai

【AiBase提要】
📱 虚拟形象创建: 利用Spiritme AI，只需用iPhone拍摄5分钟视频，即可捕捉外貌和动作，克隆虚拟形象，无需表演经验。
📄 文本到视频转换: Spiritme AI允许用户输入文本，自动生成虚拟形象演说该文本的视频，实现自然的表情展示。
🤖 AI ScriptWriter功能: 支持自动编写视频对话或旁白，根据用户提供的信息，简化视频制作过程，只需两次点击操作。

🤖📈💻💡大模型动态

SOLAR10.7B大模型屠榜HuggingFace

深度学习领域的新技术DUS（深度扩展方法）由Upstage AI提出，成功在SOLAR10.7B大模型上实现创新的羊驼拼接，高效集成，并在HuggingFace排行榜中取得显著成绩。

论文地址:https://arxiv.org/pdf/2312.15166.pdf

【AiBase提要:】
🚀 技术创新: DUS技术通过巧妙选择Mistral7B底材，拼接两个羊驼，并采用层次删除方法，成功超越传统扩展方法，达到令人瞩目的成果。
💡 数据安全与开源: 团队回应数据泄露质疑，提供数据污染测试结果，SOLAR10.7B基础模型和微调模型以Apache2.0协议开源，受到科研社区广泛关注。
👥 用户反馈: 试用者对DUS技术在从JSON格式数据中提取数据的表现表示满意，证明了该技术在实际数据处理上的优越性。

📰🤖📢AI新鲜事

Xbox被指使用AI生成的艺术作品推广游戏

Xbox因在社交媒体上使用由AI生成的艺术作品推广独立游戏而受到指责，引发了关于AI艺术应用的争论，尤其是涉及艺术品的情况。

【AiBase提要:】
🤖 一些玩家指责Xbox在社交媒体上使用AI程序生成的艺术品推广独立游戏，引发了关于AI艺术应用的争议。
📅 Xbox账号在发推询问粉丝对2023年最喜欢的独立游戏的看法时使用了一幅由AI生成的艺术作品，细节异常引发玩家不满，最终Xbox删除了推文。
🖌️ 尽管一些开发者对AI艺术持积极态度，但许多玩家批评其在游戏和广告中的应用，认为引发了社区不满。

LG发布全新AI笔记本

LG公司推出最新LG gram系列笔记本，包括Pro型号16Z90SP和17Z90SP，以及17.16.15和14型号17Z90S、16Z90S、15Z90S和14Z90S。新款支持LG gram Link应用的AI功能，实现屏幕镜像和文件照片分享。

【AiBase提要:】
🌐 LG发布LG gram系列新款笔记本，融合AI功能，支持屏幕镜像和文件分享。
💻 Pro型号搭载Intel处理器、NVMe PCIe4.0SSD和NVIDIA GeForce RTX3050，支持AI Boost。
🔄 LG gram Link构建互联设备生态系统，提升连接性和可扩展性。

奥特曼挖走iPhone设计师联手打造AI移动设备

苹果设计副总裁Tang Tan加入Jony Ive的LoveFrom公司，与OpenAI合作研发替代智能手机的AI移动设备，计划寻求软银超10亿美元投资。

【AiBase提要:】
🤝 合作计划: Tang Tan离职加入LoveFrom公司，与OpenAI合作研发AI移动设备，计划寻求超10亿美元投资。
📱 产品方向: LoveFrom设计，OpenAI提供软件支持，可能得到软银硬件支持，旨在独立开发避免依赖苹果或谷歌系统。
🚀 背景与动机: Jony Ive与OpenAI合作是在三年协议结束后，意图避免依赖于苹果或谷歌系统，独立开发AI移动设备。

LG开发了一款AI双足机器人

LG最新研发的双足AI机器人将在2024年CES上亮相，可通过摄像头监控和互动宠物，为离家需照顾宠物的人提供便利。

【AiBase提要:】
🤖 智能互动: LG的小型双足AI机器人配备摄像头和人工智能技术，能实时监控宠物行为，用户可远程控制并与宠物进行语音交流。
🐶 照顾解决方案: 机器人为离家需照顾宠物的人提供解决方案，可远程监控宠物状态，提供定制化服务，甚至检测宠物健康状况。
🏠 多功能应用: 除照顾宠物外，机器人还可用于家庭安防、家庭娱乐，是一款多功能智能设备，提供便利和更多与宠物互动的乐趣。

OpenAI员工:未来的关键技能不是提示工程，而是与人类沟通的能力

一位OpenAI员工在社交媒体上表示，未来的关键技能不是提示工程，而是阅读、写作和口语。有效沟通能力将在2024年成为真正重要的技能，即便是对于年薪六位数以上的提示工程师。

【AiBase提要:】
📚 阅读、写作和口语将成为未来最重要的技能。
💬 提示工程与与人沟通并无不同，OpenAI员工表示。
🤖 对话AI系统的关键在于有效沟通技能，而不仅仅是提示工程。

麻省理工用AI发现新抗生素类别

麻省理工大学科学家利用人工智能发现新型抗生素，可对抗耐药性金黄色葡萄球菌（MRSA），是60年来首个重要的抗生素突破。

论文地址:https://www.nature.com/articles/s41586-023-06887-8

【AiBase提要】:
🧠 AI筛选新抗生素: 麻省理工大学用深度学习模型筛选出280种新抗生素候选物，成功对抗MRSA。
🔬 双重方法评估效果: 研究团队结合抗微生物活性预测和毒性评估，找到对细菌有效且对人类安全的化合物。
💡 揭开深度学习“黑箱”: 研究旨在深入了解模型如何学习预测出优质抗生素分子。

👨‍💻💡🎯聚焦开发者

麻省理工开源Stream Diffusion

该框架采用流批处理去噪和残差无分类器指导方法，实现了流畅、高吞吐量的图像生成。流批式去噪优化了图像生成速度和效率，残差无分类器指导降低了计算成本，同时引入流水线作业和随机相似度过滤提高了系统整体性能。

开源地址:https://github.com/cumulo-autumn/StreamDiffusion

论文地址:https://arxiv.org/abs/2312.12491

【AiBase提要:】
🚀 创新性框架: 东京工业、麻省理工等联合开源的Stream Diffusion框架，8天内获6100颗星，可商用。
⚙️ 流批处理优化: Stream Diffusion采用流批处理去噪，提高图像生成速度和效率，实现了实时交互。
💡 性能提升: 框架引入残差无分类器指导、流水线作业和相似度过滤，超过91FPS的生成帧率，显著降低功耗。

清华大学提出三维重建的新方法O²-Recon

清华大学团队提出O²-Recon方法，通过2D扩散模型和神经隐式表面场，能更准确、完整地重建三维物体，支持大角度旋转和平移，具有广泛应用前景。

论文链接:https://arxiv.org/abs/2308.09591

【AiBase提要:】
👁‍🗨 O²-Recon利用预训练的扩散模型填补图像遮挡部分，通过神经隐式表面场实现更准确、完整的三维重建。
🔄 O²-Recon支持大角度的旋转和平移，为物体级别的三维表面重建技术带来新突破，具有广泛的应用前景。
🌐 该方法有望在AR/VR/MR、机器人等领域得到应用，为三维重建技术带来新的可能性。

清华新文生3D方法TICD引领SOTA

清华大学刘永进教授课题组的TICD模型在文生3D领域取得显著成绩，通过引入多视角一致性先验，提高了生成的3D模型质量。该模型在T3Bench数据集上的测试表现出色，展现了在单对象、单对象带背景、多对象提示集上的最佳成绩。

论文地址:https://arxiv.org/pdf/2312.11774.pdf

【AiBase提要:】
🚀 创新方法: TICD模型以多视角一致性为先验，通过文本和图像作为条件，纳入NeRF监督信号，有效提高了生成的3D模型一致性和质量。
🌐 全面优势: TICD在T3Bench数据集上通过定性和定量测试，不论是在单对象、单对象带背景还是多对象提示集上均取得最佳成绩，彰显了其整体优势。
🌈 问题解决: TICD方法成功解决了预训练扩散模型的局限性，克服了生成几何结构较差的问题，为文生3D领域带来了新的突破。

（举报）

相关推荐
大家在看

关键词：

AI绘画

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
荐AI日报：对标GPT-4o！开源大模型Moshi登场；Google Pixel 9新增多个AI功能；ElevenLabs发布消音神器VOICE ISOLATOR

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、对标GPT-4o！任天堂将谨慎对待生成式人工智能的使用，依靠团队内部的创造力和经验。

Moshi
荐好消息！Stable Diffusion 3允许商业化，很快开源更大版本模型

7月6日凌晨，著名开源大模型平台StabilityAI修改了社区许可协议，最新发布的文生图模型StableDiffusion3Medium允许商业化。如果企业、个人开发者每年收入低于100万美元，只需向StabilityAI填写一份申请，就可以免费将SD3-M用于商业化，包括数据微调、开发生成式AI应用等。红色的火星表面，人类建立的第一个殖民地，有透明穹顶覆盖的居住区，科学家们在户外进行研究，背景是隐约可见的地球。

SD3
中国AI大模型论文数量全球第一，清华力压麻省理工、斯坦福

论文是研究新技术、开发新产品获取“图纸”的重要途径之一，OpenAI的研究人员正是借鉴了Transformer的论文，才开发出了对全球各行业影响巨大的产品ChatGPT。论文的数量、通过率和被引用次数是衡量一个国家科技人才素质，以及技术创新能力的重要标准之一。这也充分证明了，中国对生成式AI、大模型的重视程度、技术环境以及拥有庞大的AI人才库。

人工智能技术创新论文研究
PaintsUndo完全指南：数字绘画AI模型 - 使用方法教程与免费使用入口

探索PaintsUndo能为你带来哪些改变为什么选择PaintsUndo？PaintsUndo不仅仅是一款产品——它是一项革命性的技术，致力于模拟和重现绘画过程中的笔触和步骤。通过AIbase，您可以轻松发现最适合您需求的人工智能工具，解锁AI的力量。

PaintsUndo
荐ChatGPT，成了这个“智力障碍”儿童的赛博守护灵。

之前常常跟大家聊，AI对于普通人来说，存在的意义可能有什么。一千个哈姆雷特，每个人的答案都是不同的。

ChatGPT
荐AI日报：Claude推Artifacts分享、重新混合功能；Magnific发布PS插件；Ollama0.2版本发布

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、独立开发者狂喜！这一方法通过智能数据批次筛选，优化了训练效率和效果，为人工智能领域带来重大突破。

Claude
荐陶哲轩点破「天机」：不懂数学别想靠ChatGPT飞升！

【新智元导读】冲锋在AI辅助数学研究第一线的陶哲轩，近日又有「神总结」:ChatGPT提升的，是我们在编码、图表等次要任务上的能力;真要搞好数学研究，基础不扎实的话，AI也是没用的。使用ChatGPT一年半了，陶哲轩的感想如何?最近，一直冲锋在探索AI辅助研究功能前线的数学大神陶哲轩，总结了ChatGPT对自己数学研究过程的帮助。大神毕竟是大神，陶哲轩很快又再一次跑通了�

ChatGPT
Stable Diffusion 教程：玉石翡翠材质图标

logo版权归各公司所有！本笔记仅供AIGC案例练习展示！通过详细的步骤和实例，学习如何将AI绘图与宝石的天然美相结合，创造出独特的玉石图标，提升设计的质感和专业度。

SD教程 AI会员教程
荐AI日报：Open-Sora Plan v1.2发布；Mistral Large2突然开源；腾讯智影推智能画布功能

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/Open-Sora Plan v1.2版本引入新的3D全注意力架构，提升了对物理世界的理解能力。更新带来了全新的3D全注意力架构，文本生成视频能力升级，清晰度和一致性提升，空间与时间完美融合

Open-Sora Plan v1.2
荐AI日报：性能超GPT-4o！Meta4050亿参数开源模型Llama3.1遭泄漏；Stability AI开源音频生成模型Stable Audio Open

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、震惊AI界！14、微软研究院推AI框架E5-V:用文本对的单模态训练简化多模态学习降低成本微软研究院与北京航空航天大学联合推出的E5-V框架通过单模态训练简化多模态学习，降低成本，在多个任务中展现出优异性能，代表了多模态学习的重大进步。

Llama3.1

知了zKnown:致力于信息降噪 / 阅读提效的个人知识助手

知了 zKnown 是一款 AI-Native 构建的个人知识助手，专注于信息降噪和阅读提效。它通过多端同步、多渠道总结、长文本支持等功能，帮助用户高效地管理和整理信息。产品的主要优点包括：- 多端同步：用户可以在移动app、桌面客户端、网页版、小程序等多个平台同步使用。- 多渠道总结：支持微信公众号、知乎、简书、36Kr、少数派等多个渠道的文章总结。- 长文本支持：最长支持总结3万字的文章内容。- 摘要导出：用户可以将摘要保存到 Notion、Flomo 等平台。- 产品背景：知了 zKnown 致力于通过 AI 技术提升用户的阅读和信息管理效率，适合需要高效处理大量信息的用户。

信息管理阅读提效 AI助手

MBox AI Meet:实时转录与会议总结的谷歌会议扩展

MBox AI Meet是一款免费Chrome扩展，专为Google Meet设计，提供实时转录和自动生成会议总结的功能。它利用AI技术帮助用户在会议中专注于讨论，而无需担心记笔记。该工具通过实时转录捕捉会议的每一个细节，并在会议结束后自动生成总结，确保用户不会错过任何重要信息。MBox AI Meet的隐私优先策略确保会议安全，不存储任何音频或视频内容。此外，该扩展还计划在未来更新中增加更多AI功能，如发言人识别、实时AI助手等。

AI 会议管理实时转录

Klee:本地安全AI，保障数据隐私。

Klee是一款macOS原生的AI助手应用程序，专注于本地处理数据，确保数据安全和隐私。它使用先进的AI技术，如RAG（检索增强生成）和开源大型语言模型，如Llama 3和Mistral，为用户提供高效、智能的笔记、搜索和知识管理功能。Klee的主要优点包括本地运行以保护隐私、支持团队协作、免费使用以及优化的macOS体验。

AI助手 macOS原生数据隐私

Kipps.AI:快速构建AI助手，提升业务效率

Kipps.AI 是一个在线平台，允许用户在短短两分钟内构建自己的AI助手，并将其集成到业务中。该平台支持多种数据源，如PDF、Notion、网站链接和文本，用户只需提供这些数据，Kipps.AI 会处理其余部分。它还与常用的工具如GoDaddy、Wordpress、Drupal、Squarespace、Magento和Wix等进行集成，使得用户可以轻松地将AI助手集成到现有的业务流程中。

AI助手自动化数据处理

CrossPrism for MacOS:图像识别、标注和关键词生成工具

CrossPrism for MacOS 是一款专为摄影师设计的图像识别、标注和关键词生成工具。它利用多核 CPU、GPU 和神经引擎，能够识别物种、生成标题和描述，并支持模型训练的可定制性。用户可以在本地自动标注无限量的原始照片，确保所有照片安全地存储在 Mac 上，无需担心云服务中断、数据锁定或文件传输问题。其20多个专家模型可以对从鸟类到地标的各种内容进行分类，并提供新的视角来整理目录和重新发现旧照片。此外，它还支持视频处理、Lightroom 插件、图像质量评估等功能，使其成为一个强大的筛选工具。

AI视野：腾讯云AI绘画上线SaaS版本；ChatGPT将推新功能Sunshine;SOLAR10.7B大模型屠榜；LG发布全新AI笔记本；麻省理工开源Stream Diffusion

今日大家都在搜的词：

热文

站长商机