首页 > 业界 > 关键词  > Midjourney最新资讯  > 正文

AI视野:Midjourney V6史诗级升级;ChatGPT新增存档聊天记录功能;阿里DreaMoving开源;百度千帆AppBuilder开放

2023-12-21 15:23 · 稿源:站长之家

📰🤖📢AI新鲜事

Midjourney V6史诗级升级,网友惊呼太逼真!

网友在Midjourney V6第二次社区评价中惊叹其逼真神图,光影效果出众,上线倒计时,可能在今明两天内发布。

image.png

【AiBase提要:】

😲 Midjourney V6社区评价引发轰动,图像逼真程度令人难以置信,光影效果和细节表现惊艳。

🚀 V6即将上线,传言将在今明两天发布,成为AI生图领域的新巅峰,引起网友期待和兴奋。

🎨 Midjourney V6改善了语言提示的理解能力,用户能更准确地指导图像生成,为创作提供更大控制权。

ChatGPT新增存档聊天记录功能

12月21日,OpenAI在社交平台上发布消息,宣布旗下人工智能对话产品ChatGPT新增存档聊天记录功能。

微信截图_20231221080056.png

【AiBase提要:】

🔄 存档聊天记录功能: OpenAI的ChatGPT现在支持在“设置”中存档聊天记录,用户可以方便保存对话,而无需删除。

📱 跨平台推出: 该功能已在Web和iOS平台上推出,并计划在安卓版本上线。

🔍 更多操作选择: 用户可在设置中对聊天文档进行多种操作,包括删除、命名和查看。

阿里可控视频生成框架DreaMoving开源

阿里推出的可控视频生成框架DreaMoving正式开源,基于扩散模型,通过人脸、姿势序列和文本提示生成高质量、定制化的人类视频。用户只需提供图像和提示即可生成对应视频,实现身份、运动和外观的灵活控制。

1.jpg

【AiBase提要:】

👾 DreaMoving是阿里基于扩散模型的视频生成框架,能根据人脸、姿势和文本提示生成高质量的定制化人类视频。

🌐 通过引入Video ControlNet和Content Guider组件,DreaMoving实现了对运动的精准控制和文本提示的内容嵌入转换。

🚀 DreaMoving开源,提供了代码和试玩地址,让用户体验其强大的泛化能力和定制化视频生成功能。

百度千帆AppBuilder开放

百度智能云在2023百度云智大会上发布了20多款全栈产品,包括优化大模型训练的计算平台、全新计算实例、边缘计算节点等,同时推出了千帆AppBuilder以满足企业AI原生应用开发需求。

微信截图_20231221081922.png

【AiBase提要:】

🚀 全栈产品发布:百度智能云发布多款产品,从基础设施到通用计算再到分布式云,全面满足大模型落地需求。

💻 AppBuilder亮相:推出千帆AppBuilder,为企业提供代码态和低代码态两种形态,助力高效AI原生应用开发。

📈 成绩亮眼:千帆平台大模型API调用量增长10倍,已服务4万家企业用户,成本最高可下降90%。

百度推出文心一言专业版尊享礼品卡

百度文心一言发布专业版尊享礼品卡,提供1至12个月不同会员时长,其中12个月限时658.8元。礼品卡功能升级包括文心大模型4.0,支持更长输入输出,网页端享高阶插件和画图效果升级。

微信截图_20231221142147.png

【AiBase提要:】

🎁 价格优惠:12个月专业版尊享礼品卡限时658.8元,满足用户各种需求。

🚀 功能升级: 文心大模型4.0全面升级,提供更强大的语言理解和生成能力。

🌐 网页体验提升: 尊享礼品卡用户在网页端将享受高阶插件和画图效果升级,提升使用体验。

苹果最新AI研究或彻底改变iPhone体验

苹果通过HUGS技术实现从短视频生成逼真的3D动态头像,并通过内存优化在有限内存设备上高效运行大型语言模型,为用户提供更沉浸的视觉体验和更高效的AI推理。

【AiBase提要:】

🎥3D动态头像技术: 苹果的HUGS技术可以从短视频中生成逼真的3D动态头像,训练速度提高了100倍以上,为更沉浸的视觉体验打开新可能。

🧠 内存优化: 苹果攻克了在有限内存设备上运行大型语言模型的难题,通过降低数据传输量和优化读取方式,在iPhone等设备上高效运行复杂的AI系统。

🚀 AI愿景: 苹果通过这些技术展现在AI领域的领导地位,未来可能推出更多基于内存优化的AI应用,提升设备性能和人工智能服务的可用性。

together.ai获得1.025亿美元A轮融资

together.ai是一家全栈AI技术公司,通过其GPU算力云平台实现AI模型训练加速9倍,获得1.025亿美元A轮融资,致力于推动开源AI发展。

【AiBase提要】

🚀 技术创新与融资:together.ai通过FlashAttention等技术推动AI模型训练速度飙升9倍,获得1.025亿美元A轮融资,包括NVIDIA在内的多家投资者参与。

🌐 开源生态倡导:作为全栈AI公司,together.ai拥抱开源生态,创建开放生态系统,挑战闭源大模型公司,推进人工智能领域的开源发展。

💡 自有技术与数据集:together.ai不仅拥有最快推理技术堆栈,还提供GPU Clusters、Fine-Tuning服务,以及自有数据集和示例性开源AI模型,构建全方位AI服务平台。

VAST推动通用3D大模型,实现「秒级」时代的3D生成

VAST公司的3D生成技术,通过自研大模型Tripo,将传统3D建模的生产周期从几天甚至数月缩短至「秒级」,标志着生成式AI在3D领域的重要突破。

【AiBase提要:】

🚀 VAST公司推出自研的3D大模型Tripo,实现「秒级」时代的3D生成,标志着传统建模方式的革新。

👩‍💻 该公司算法团队来自海内外顶尖高校和技术大厂,致力于降低高质量3D资产和环境制作的专业知识和成本。

🌐 VAST探索通用3D大模型,解决AI在3D生成领域的挑战,缩短生产周期,提高生成质量、速度和可控性。

🤖📈💻💡大模型动态

智谱开源视觉语言模型CogAgent

智谱AI开源的CogAgent是一款拥有180亿参数规模的视觉语言模型,在GUI理解和导航上表现出色,支持高分辨率视觉输入和对话问答,同时具备OCR相关任务的能力。

【AiBase提要:】

🤖 CogAgent是一款180亿参数的视觉语言模型,在GUI理解和导航方面表现出色。

📸 模型支持高分辨率视觉输入和对话问答,可针对任意GUI截图进行任务推理。

🔍 CogAgent还通过OCR预训练和微调提升了相关任务的性能。

🤖📱💼AI应用

AI图片编辑神器Anydoor:开启图片编辑的任意门 图片主体随意移动

香港大学、阿里巴巴和蚂蚁集团联合研发的AnyDoor利用扩散技术,实现零样本对象-场景合成,让设计师能轻松将物体自由移动到不同场景中,为图像编辑领域带来新的可能性。

【AiBase提要:】

🚪 创新技术: AnyDoor基于扩散技术,通过一次训练实现多样化物体-场景组合,解决传统模型需要调整参数的问题。

🎨 自动摆姿势: 设计师可使用AnyDoor让贴图穿进背景图,实现自动摆姿势、站位的「魔法」,无需担心合照缺人的问题。

✨ 多种实际应用: AnyDoor不仅可用于物体移动和交换,还能轻松扩展为多主体合成和虚拟试穿,在图像编辑领域展现出巨大潜力。

奇域AI:符合中国宝宝审美的AI绘画平台

奇域AI是一个以中式审美为特色的AI绘画社区,致力于打造一个汇聚中国文化艺术的创作平台,提供轻松上手的绘画体验,并允许创作者通过分享作品实现变现。

image.png

内测地址:https://top.aibase.com/tool/qiyu

【AiBase提要】

🎨 中式审美平台: 奇域AI以中国文化元素为基础,呈现极具中式审美的绘画风格,为创作者提供独特创作空间。

🚀 轻松上手体验: 社区提供新手引导,汇聚顶尖AI绘画创作者,促进创作者学习和启发。

💼 创作变现机会: 创作者可通过分享邀请链接和作品赚取额度,同时提供商业用途的生成图片,助力个人IP知名度提升。

👨‍💻💡🎯聚焦开发者

苹果最新研究:将有限内存推理速度提高25倍

本文介绍了苹果最新研究,通过将大型语言模型参数存储在闪存中,在有限内存设备上实现了将推理速度提高25倍的高效方法。

image.png

论文地址:https://arxiv.org/pdf/2312.11514.pdf

【AiBase提要:】

💡 存储优化方案: 苹果研究采用在有限内存下将模型参数存储在闪存中的策略,实现了对计算和内存需求的高效管理。

🔄 推断效率提升: 通过窗口化策略和行列捆绑技术,成功运行比可用DRAM容量大两倍的模型,推断速度分别提高了4-5倍和20-25倍。

🌐 新可能性开启: 结合稀疏感知、上下文自适应加载和硬件导向设计,为在内存有限设备上进行大型语言模型推断开辟了新的可能性。

多模态SVG生成模型StarVector 视觉质量显著增强

StarVector是一种多模态SVG生成模型,通过集成代码生成大型语言模型和视觉模型,实现了准确表示图像像素的不受限制的SVG生成,在视觉质量和复杂性处理上显著增强,为SVG生成技术带来新突破。

image.png

论文地址:https://arxiv.org/pdf/2312.11556.pdf

【AiBase提要】

🌟 StarVector集成CodeLLM和视觉模型,生成准确SVG图像表示。

🔍 利用CLIP图像编码器和适配器实现对齐标记和代码标记学习。

📈 在SVG-Bench基准测试中,StarVector相较当前方法有显著提升,推动SVG生成技术进步。

斯坦福提出“统一归因”框架

随着大型语言模型在实际业务中的广泛应用,斯坦福大学提出了“统一归因”框架,旨在验证大模型输出的真实性、可靠性和安全性。

论文地址:https://arxiv.org/abs/2311.12233

【AiBase提要:】

🔍 协同归因功能: 引文生成验证、知识检索验证和事实验证,追踪大模型输出来源,确保准确性。

💡 贡献归因方法: 影响函数验证、数据模拟器验证和数据模型验证,评估训练数据对模型输出的影响。

🚀 统一归因框架: 斯坦福整合协同和贡献归因,为开发者提供大模型安全、内容验证的一体化解决方案。

上交大新框架PowerInfer让2080Ti推理速度增11倍

上海交大IPADS实验室推出的PowerInfer开源推理框架,通过稀疏激活和CPU/GPU混合计算,使2080Ti能以11倍速度运行70B大模型,无需量化。

论文地址:

https://ipads.se.sjtu.edu.cn/_media/publications/powerinfer-20231219.pdf

【AiBase提要】

🚀 推理速度飙升: PowerInfer让2080Ti在个人电脑上推理大模型速度提升11倍,无需量化,仅需24G4090。

🤖 稀疏激活技术: 利用稠密模型中的稀疏激活,PowerInfer通过预测路由模块实现神经元计算的高效路由。

💡 CPU/GPU混合推理: 基于神经元局部性特征,PowerInfer设计了CPU/GPU混合推理系统,弥合了硬件性能差距。

举报

  • 相关推荐
  • 大家在看
  • Rhea:生成高质量的短视频

    Rhea是一款由人工智能驱动的短视频生成平台。它可以通过文本输入生成高质量、快速、引人入胜的短视频。Rhea还可以为您的视频生成字幕,使其更具可访问性。您还可以自定义字幕的样式,以与您的品牌相匹配。您可以根据需要定制视频的风格,例如使用定制的配色方案和字体。Rhea适用于各种用途的视频生成,从教育内容到营销视频不一而足。

  • LIDO:一键生成独特的AI音乐,为您的歌曲、TikToks、Reels等创作无版权的音乐。

    LIDO是一款AI音乐生成器,可以快速生成带有自定义歌词和风格的独特歌曲。无论您是新手音乐人还是想要探索音乐无限可能性的人,LIDO都是您释放创造力的一站式解决方案。它生成的音乐具有无版权,可以用于您的歌曲、TikToks、Reels等。定价信息请访问官网了解。

  • IceburgCRM:智能创建任意类型的CRM

    IceburgCRM是一个智能创建CRM的平台,使用AI技术,可以快速转换现有的MySQL数据库为全面的CRM系统。用户可以通过描述需求、选择预设模板或上传现有数据库来创建自己的CRM。IceburgCRM提供了各种预设模板,包括收藏品目录、葡萄酒管理、健身工作室、职业网络、手工艺品供应商、咖啡爱好者、养蜂等。IceburgCRM还提供AI辅助填写和数据导入导出功能,以及多种主题、工作流等特点。IceburgCRM有免费和付费版本可供选择。

  • Mynt:免费AI写作工具

    Mynt是一个免费的AI写作工具,提供单一界面生成各种内容。用户可以导入数据、讨论想法,生成各种文档和内容。Mynt使用先进的语言模型,帮助用户以更高效的方式生成高质量的内容。Mynt有不同的付费计划,包括免费试用和按需付费,满足不同团队的需求。

  • emojiu.cc:搜索和复制粘贴 iPhone 表情符号

    Emoji Copy Paste 是一个可以搜索和复制粘贴 iPhone 表情符号的工具。用户可以通过简单的点击,探索各种表情符号,包括心形、笑脸、骷髅、书呆子、悲伤、iPhone、眼睛、星星、点赞、亲吻和手心等表情符号。增强您的在线沟通,轻松表达自己。

  • ioPartners:连接3D可定制的AI伙伴。

    ioPartners是您的个人AI助手,与您的3D AI ioPartner进行无尽对话,定制外观、互动,并塑造其个性特点,以打造完美的伙伴,共同创造独特的故事和体验。记忆保留功能让您的AI伙伴记住对话的细节,打造个性化和不断发展的互动。通过选择和组合不同特点,为您的ioPartner塑造独特的个性。保护您的隐私,对话保密,不与第三方共享数据。无需下载或安装,直接在浏览器上运行。

  • Gen Master:All-in-One AI工具

    Genmaster.ai是一款集成了AI写作、图像生成和聊天机器人等功能的全能AI平台。通过我们的创新工具,您可以简化项目流程,释放创造力。

  • Campana:为您的业务提供竞争情报

    Campana是您获取竞争情报的最佳方式。当竞争对手更改网站、发布新功能、在社交媒体上发布内容等时,您将收到通知。启用竞争监测,保持竞争优势。

  • Instafill:智能表单填写工具

    InstaFill AI是一款智能表单填写工具,可以自动识别和填写各种表单,提高工作效率。它具有强大的表单识别和智能填写功能,可以自动填写各种常见表单字段,并支持自定义规则和模板。它可以广泛应用于各个行业的表单填写场景,例如在线购物、注册申请、表格填写等。InstaFill AI提供免费试用和付费版本,灵活满足用户的需求。

  • SermoAI:用于银行和金融科技公司提供全面客户支持的AI聊天机器人

    SermoAI是一款AI聊天机器人,帮助银行和金融科技公司以客户的母语提供全面的客户支持。它能够处理不断增长的支持需求,消除语言障碍,提供个性化答案,快速解决问题,自动化客户沟通,并降低支持成本。该产品的定价信息请联系官方网站获取。

  • Open Agent Studio:建立未来无法实现的业务自动化

    Open Agent Studio是一个无需编写易碎代码选择器或计算机视觉,就能够使用简单的英语来建立以前无法实现的业务自动化的新一代RPA工具。我们引入了强大的新RPA概念,例如“语义目标”,以简单的语言来创建比之前一代易碎代码选择器更稳健且易于使用的代理程序。用户可以使用Agent Recorder记录点击、鼠标移动和键盘输入,以便快速构建和编辑代理程序。Open Agent Studio是一个独特的无代码合作伙伴构建工具,为用户提供了一种在其他所有RPA工具中都无法实现的解决方案。

  • QnAPe:问答社区,学习交流平台

    QnAPe是一个问答平台,连接提供独特见解和高质量答案的人们。让我们一起学习领导。

  • LabEx:通过AI和动手实验学习编程

    LabEx是一个结合AI技术和动手实验室的教育平台,专注于提供Linux、Python、Docker、Kubernetes、机器学习等技术的实战学习体验。通过互动式的学习环境和结构化的技能树,用户可以逐步掌握技术技能,并在完成技能树后参与真实世界项目,巩固所学知识。LabEx还拥有AI助手Labby,为用户提供实时的编程帮助和答疑。此外,LabEx承诺每完成一个技能树,就会种植一棵真实的树,让学习之旅也能为地球做出贡献。

  • Ready AI Goal + Habit Tracker:为您打造和维持积极习惯的一款应用

    Ready是一款旨在帮助您建立和保持积极习惯,从而实现更快乐、更健康、更充实的生活的应用。它提供个性化的智能辅导,包括健康习惯、平衡生活、营养指导、个性化饮食计划、健身目标、个性化锻炼计划、早晨日常、赋能习惯、个性化指导、成功规划、目标设定、进展跟踪、个人成长等功能。Ready通过AI教练提供个性化指导,24/7全天候服务,为您提供通往更好生活的路径。

  • Mini-Gemini:多模态AI模型,图像理解与生成兼备

    Mini-Gemini是由香港中文大学终身教授贾佳亚团队开发的多模态模型,具备精准的图像理解能力和高质量的训练数据。该模型结合图像推理和生成,提供不同规模的版本,性能与GPT-4和DALLE3相媲美。Mini-Gemini采用Gemini的视觉双分支信息挖掘方法和SDXL技术,通过卷积网络编码图像并利用Attention机制挖掘信息,同时结合LLM生成文本链接两个模型。

  • ControlNet++:提升文本到图像生成的可控性

    ControlNet++是一种新型的文本到图像扩散模型,通过显式优化生成图像与条件控制之间的像素级循环一致性,显著提高了在各种条件控制下的可控性。它通过使用预训练的判别性奖励模型来提取生成图像的对应条件,并优化输入条件控制与提取条件之间的一致性损失。此外,ControlNet++引入了一种高效的奖励策略,通过向输入图像中添加噪声来扰动图像,然后使用单步去噪图像进行奖励微调,避免了与图像采样相关的大量时间和内存成本。

  • Suno 音乐生成器:基于 suno.ai 的文字快速创作音乐网站

    Suno 音乐生成器是一个基于 NextJS 开发的非官方 suno.ai 音乐生成网站,用户可以通过输入 prompt 快速生成自己想要的歌曲。通过 JavaScript 逆向工程解析 suno.ai 生成歌曲的 API,内置 token 更新和保活功能,无需担心 token 过期。

  • Cubeo AI:AI助手,业务自动化

    Cubeo是一款AI助手,可帮助您的业务实现销售提升、高质量潜在客户生成、品牌建设和业务自动化。它可以为您的业务提供全天候的支持,包括市场营销、销售、潜在客户生成、客户支持、人力资源、内部流程等方面的自动化。

  • STORM:自动化生成深度长篇内容

    STORM是由斯坦福大学开发的系统,能够自动化编写具有广度和深度的长篇文章,类似于维基百科。它通过互联网搜索自动搜集资料,模拟专家与作者对话生成结构化大纲,并最终生成完整文章。STORM还具备文章润色功能,优化语句和结构,确保内容流畅准确。

  • 多种草AI:小红书AI创作工具

    多种草是一个专为自媒体博主、市场运营设计的 AI 智能创作平台,服务自媒体工作者在抖音、小红书、微信等全平台文案及图文撰写。它提供多种功能,包括小红书文案创作、小红书敏感词检测、小红书账号定位分析、文案配图生成、小红书文案加表情、内容选题灵感等。用户可以根据不同的需求,使用该工具生成符合小红书风格的文案和图文,提升内容质量和创作效率。

今日大家都在搜的词: