首页 > 业界 > 关键词  > Midjourney最新资讯  > 正文

AI日报:MJ推模型个性化功能;ComfyUI完成SD3 Medium模型适配;字节上线AI交友“小黄蕉”;微信输入法内测AI功能

2024-06-12 15:39 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、Midjourney推出模型个性化功能

Midjourney最近推出了一项创新的模型个性化功能,允许用户根据审美偏好微调MJ模型,使生成的图像更贴近个人喜好。个性化模型通过分析用户喜欢的图片来实现,学习用户独特审美,满足用户品味。用户需对至少 200 张图片进行评分或点赞,启用个性化功能后,在提示后添加特定代码分享个性化效果。

image.png

【AiBase提要:】

🎨 模型个性化功能允许用户根据审美偏好微调MJ模型,使生成图像更符合个人喜好。

🔍 个性化模型通过分析用户过往喜欢的图片,学习用户独特审美,提高生成图像准确性。

💡 用户需对至少 200 张图片进行评分或点赞,启用个性化功能后,在提示后添加特定代码分享个性化效果。

详情链接:https://www.midjourney.com/rank

2、为了迎接即将开源的SD3 Medium 模型 ComfyUI已提前完成适配

SD3Medium 模型即将开源,为了迎接这一重要时刻,ComfyUI已经提前进行了适配工作,做好了迎接新模型的准备。届时,大家生图可以体验更真实的质感,更好的构图,更优的性能以及更出色的微调能力。

QQ截图20240611174410.jpg

【AiBase提要:】

📈 SD3 Medium 模型即将开源,ComfyUI已完成提前适配工作。

🖼️ SD3 Medium 在图像生成方面取得显著进步,能够生成细节丰富且高度逼真的图像。

💡 SD3 Medium 在生成高质量、细节丰富的图像方面具备强大能力。

详情:

https://github.com/comfyanonymous/ComfyUI/commit/8c4a9befa7261b6fc78407ace90a57d21bfe631e

3、微信输入法内测AI功能 只要按这个键就可以获取AI回答

微信输入法内测版本新增AI助手功能,按“=”获取AI生成回答。emoji和颜文字推荐支持。增强对时间、日期输入格式支持。

image.png

【AiBase提要:】

🤖微信输入法新增AI助手功能,按“=”获取AI生成回答。

🤖更新加强对emoji和颜文字的支持,增强对时间、日期输入格式的支持。

🤖目前内测版本仅面向Windows用户,iOS、Android和Mac平台可能会推出。

4、字节上线AI虚拟交友聊天产品小黄蕉 可生成照片,接近真人对话场景

近日,一款名为“小黄蕉”(英文名Chatwiz)的AI虚拟交友聊天产品上线,其特点是能够生成照片,且对话过程非常接近真人。经查证,该产品的工商主体为北京臻鼎科技有限公司(番茄小说),而其背后的实际控制者是字节跳动公司。

QQ截图20240611160830.jpg

【AiBase提要:】

⭐ 小黄蕉是AI虚拟交友聊天产品,能生成照片,对话接近真人。

⭐ 字节跳动积极布局AI大模型,推出多款AI产品和服务。

⭐ “小黄蕉”展现了字节跳动在AI应用领域的持续探索和创新。

5、科大讯飞:将于 6 月 27 日发布讯飞星火V4.0 展示最新智能语音技术

科大讯飞将于 6 月 27 日发布讯飞星火V4.0,展示最新的端到端智能语音技术成果,包括一句话复刻、高噪音场景语音识别和多方言多语种免切换功能。刘庆峰透露,科大讯飞在全双工技术和超拟人合成技术方面处于国际领先水平。未来,科大讯飞将专注于远场高噪音多人说话场景、高表现力个性化场景等领域的研发。

【AiBase提要:】

🚀 讯飞星火V4. 0 将展示最新的端到端智能语音技术成果,包括一句话复刻、高噪音场景语音识别和多方言多语种免切换功能。

💡 科大讯飞在全双工技术和超拟人合成技术方面达到国际领先水平。

🔮 未来,科大讯飞将专注于远场高噪音多人说话场景、高表现力个性化场景等领域的研发。

6、苹果宣布新AI功能后股价创历史新高

苹果公司股价周二收盘时上涨超过7%,创下历史新高。这次反弹为苹果今年的表现带来了一线希望,展示了市场对苹果新的人工智能功能的积极态度。

image.png

【AiBase提要:】

📈 苹果股价周二上涨超过7%,创历史新高,市值有望达到3. 18 万亿美元,仅次于微软。

📱 新的人工智能功能提高了苹果设备的吸引力,包括改进的 Siri 虚拟助手和多项AI功能。

💡 开发者活动后,分析师上调对苹果股票的目标价,预计新功能将刺激秋季新iPhone系列的购买。

7、Follow-Your-Emoji:通过捕捉人物表情变化生成表情丰富的动画

Follow-Your-Emoji是一项突破性技术,通过提取视频中人物的面部特征生成全新的面部动画。这项技术精确捕捉面部特征和瞳孔点,排除面部轮廓干扰,实现更自然、更生动的动画效果。应用广泛,娱乐、教育、商业领域皆可受益。

image.png

【AiBase提要:】

👤 用户提供照片,技术生成视频动画,捕捉微妙表情变化。

🔒 身份保持,参考头像身份特征得到保留,不会丢失。

😊 表情丰富,生成各种表情,包括瞳孔运动,让动画更生动、真实。

详情链接:https://top.aibase.com/tool/follow-your-emoji

8、在线AI图像编辑器Freepik Designer

Freepik Designer是一款创新的在线AI图像编辑器,为用户提供了简单易用的设计工具,无需专业设计技能即可快速上手。它的AI工具集成让设计过程更高效,同时提供丰富的模板库,满足不同设计需求。

image.png

【AiBase提要:】

🎨 简单易用的设计工具,无需专业设计技能即可快速上手

🖼️ 提供丰富的模板库,满足不同设计需求

💡 内置AI工具集成,提升设计效率和质量

详情链接:https://top.aibase.com/tool/freepik-designer

9、埃隆・马斯克撤回对 OpenAI 的诉讼

埃隆・马斯克撤回了对 OpenAI 的诉讼,指控其违约。马斯克认为 OpenAI 放弃了非营利性使命,转向商业利益。OpenAI 否认指控,称其“不连贯”和“荒谬”。

【AiBase提要:】

🔍 埃隆・马斯克撤回对 OpenAI 的诉讼。

💡 马斯克指责 OpenAI 放弃非营利性使命,转向商业利益。

🔒 OpenAI 否认指控,称其“不连贯”和“荒谬”。

10、Yandex推出的开源工具YaFSDP 突破LLM训练效率瓶颈

Yandex开源的YaFSDP工具为全球AI社区带来了突破性的LLM训练优化方法,显著提升训练速度,节省大量GPU资源,使自主LLM训练更具可行性。Yandex承诺持续贡献全球AI社区发展,YaFSDP开源是其承诺的体现。

【AiBase提要:】

✨ YaFSDP是Yandex开源的高效大型语言模型训练优化方法,可提升LLM训练速度26%。

💡 YaFSDP专注于优化GPU通信效率和内存使用,在训练参数规模达到 300 亿至 700 亿时表现出色。

🌟 采用YaFSDP训练 700 亿参数模型可节省约 150 台GPU资源,成本节约可达 50 万至 150 万美元。

11、速度提高 410 倍!TiTok仅需 32 个token就能重建与生成图片

近期,生成模型的发展突显了图像标记化在高分辨率图像高效合成中的关键作用。TiTok是基于Transformer的一维标记化框架,将图像标记化为一维潜在序列,极大提高了生成效率和质量。它在处理高分辨率图像时表现出色,生成速度显著提高,同时保持高质量样本输出。

image.png

【AiBase提要:】

⚙️ 图像token化降低计算需求,增强生成效率和有效性。

🔍 TiTok将图像标记化为一维潜在序列,用少至 32 个离散token表示256× 256 图像。

💡 TiTok在ImageNet基准测试中表现优异,生成速度提高 410 倍,同时保持高质量样本输出。

12、MIT开发新算法DenseAV:通过观看视频学习语言含义

在MIT开发的新算法DenseAV中,研究人员利用机器理解动物的交流方式,通过观看视频学习语言的含义。该算法能够无监督学习单词的含义和声音的位置,实现跨模态连接的自然区分。团队希望应用于理解新语言和发现不同信号之间的模式关联。

image.png

【AiBase提要:】

🧠 DenseAV是双编码器接地架构,学习高分辨率、语义意义和视听对齐的特征。

🔍 无监督学习发现单词含义和声音位置的关联,自动区分语言和声音。

🌐 在跨模态检索方面优于以前的模型ImageBind,应用于学习大量视频和理解新语言。

详情链接:https://top.aibase.com/tool/denseav

13、让AI更合乎伦理:Source.Plus 提供高质量AI训练数据

Spawning 致力于为艺术家提供更多对其作品在线使用的控制权,Source.Plus 项目推出的数据集包含近 4000 万个公有领域图片和采用 Creative Commons CC0 许可的图片,为AI模型的训练提供高质量的数据。该平台为艺术家和创作者提供了更精细的作品使用权限管理,为AI技术的发展和应用注入新活力。

image.png

【AiBase提要:】

🔍 数据搜索与整理:用户可快速搜索各种媒体数据,整理标注以满足训练需求。

🌟 高质量训练数据:经筛选审核的数据保证安全质量,合法同意使用。

💡 应用场景广泛:适用于各种AI模型训练,提高准确性和鲁棒性。

详情链接:https://top.aibase.com/tool/source-plusSource.Plus

14、Mistral AI获得6. 4 亿美元B轮融资

Mistral AI近期宣布获得6. 4 亿美元的B轮融资,估值提升至近 60 亿美元。这一轮融资由General Catalyst领投,多家知名投资机构和公司参与,加速了Mistral在人工智能领域的发展和国际商业化进程。

【AiBase提要:】

🚀 Mistral AI获得6. 4 亿美元B轮融资,估值提升至近 60 亿美元。

💡 General Catalyst领投,多家知名投资机构和公司参与,加速了Mistral在人工智能领域的发展和国际商业化进程。

💰 生成式AI市场预计未来十年内将以每年42%的复合增长率达到1. 3 万亿美元,Mistral此次融资将加速商业化进程,拓展分销渠道。

15、自回归图像生成模型LlamaGen

LlamaGen 是一项颠覆性创新,展示了即使在没有视觉信号归纳偏差的情况下,自回归模型也能实现领先的图像生成性能。该技术为图像生成领域带来新可能性,为未来研究提供新思路。

image.png

【AiBase提要:】

🔑 LlamaGen 提出了具有 16 倍降采样比、0. 94 的重建质量和97% 码书利用率的图像分词器,在 ImageNet 基准测试上表现优异。

🚀 LlamaGen 推出了一系列类别条件图像生成模型,范围从111M到3.1B参数,在 ImageNet256× 256 基准测试上取得了2. 18 的 FID,超越了流行的扩散模型。

💡 LlamaGen 推出了文本条件图像生成模型,具有775M参数,在 LAION-COCO 的两阶段训练后,展现出高质量的美学图像和优秀的视觉质量与文本对齐性能。

详情链接:https://top.aibase.com/tool/llamagen

16、未经同意 人工智能利用儿童照片引发隐私安全挑战

这篇文章揭露了人工智能图像生成器在训练数据集中未经允许使用巴西儿童个人照片的严重问题,引发了儿童隐私和安全的严峻挑战。文章呼吁政府和科技公司承担责任,保护儿童数据不被滥用,制定相应的保护措施。

【AiBase提要:】

🔒 未经允许使用儿童照片:人工智能图像生成器训练数据集中存在大量未经允许使用的巴西儿童个人照片,涉及儿童整个童年时期的珍贵片段。

⚠️ 儿童隐私风险:照片中包含儿童的姓名和位置信息,使其身份易被追踪,可能导致欺凌、钓鱼等风险,甚至生成不当内容。

⚖️ 呼吁保护措施:人权组织呼吁政府明确禁止未经允许使用儿童个人数据训练AI系统,加强儿童数据保护,设计追责途径。

举报

  • 相关推荐
  • 声画共舞启新程,2026央视春晚以菁彩Vivid铸就视听新标杆!

    2026年央视春晚在璀璨Vivid技术加持下圆满落幕。开场歌舞《马上有奇迹》以喜庆画面勾勒龙马精神;歌曲《立春》借婉转合唱与悠扬管弦,在三维声场中展现春日生机。全球亿万观众沉浸于这场视听盛宴,感受技术与艺术的交融。这是央视视频客户端连续第三年以璀璨Vivid技术直播春晚,该技术已从演播厅走向家庭、影院、车载座舱与城市公共屏幕,成为国民级视听基础设施。

  • 声画无界,年味同心:菁彩Vivid三度携手央视频,让前沿视听技术闪耀全球舞台

    2026年央视春晚将于2月16日晚8点播出,央视视频客户端将携手菁彩Vivid技术,为全球观众带来沉浸式视听体验。本次直播依托HDR Vivid和Audio Vivid技术,采用多机位8K超高清实时制作,结合智能算法动态优化画面亮度与色彩,呈现更真实的舞台细节和色彩层次。音频方面通过双链路方案,适配不同终端播放需求,实现环绕声和天空音效,带来身临其境的听觉感受。这不仅是一场视听盛宴,更是科技与艺术的融合,传递中华文化的温暖与力量。

  • 被大量提问内部逻辑 谷歌Gemini遭蒸馏攻击

    近日,谷歌官方披露其旗舰AI模型Gemini正遭遇商业化驱动的大规模蒸馏攻击通过重复提问诱导聊天机器人泄露内部机制。攻击者通过系统地、反复地向模型发送精心设计的提示词,试图逆向工程Gemini的内部推理逻辑与决策机制,以实现模型克隆或强化自身AI系统的目的。此类蒸馏攻击属于知识产权盗窃,尽管各大厂商已部署能够识别与阻断蒸馏攻击的机制,但由于主流大模型服务面向所有人开放,所以其本质上仍易受攻击。

  • REDMI杀入风扇赛道!REDMI K90至尊版搭载主动散热:性能开挂

    从去年开始,越来越多的手机品牌选择进军风扇赛道。除了率先发力的红魔之外,OPPO K13 Turbo系列、荣耀WIN系列以及iQOO 15 Ultra等机型也纷纷加入。 据最新爆料,今年上半年REDMI也将正式进军风扇赛道,全新的K90至尊版将支持主动散热技术,这标志着小米旗下第一款支持主动散热的性能旗舰即将诞生。

  • 海尔AI多联机互联工厂入选IDC年度领导者案例

    IDC发布2025年中国AI数字工厂领导者案例报告,聚焦空调、汽车、化工、轨道交通四大行业。海尔胶州中央空调互联工厂作为行业首个AI赋能的互联工厂入选,以AI技术贯穿制造全流程、数字孪生重构生产场景、绿色低碳引领可持续发展为核心,实现生产效率与质量双提升。订单响应周期从15天缩短至7天,换线时间缩至5分钟,配送效率提升40%。工厂通过AI算法管理200余家供应商,实现端到端可视化协同,产品能效提升20%,单台能耗下降40%,年减碳1.2万吨。案例彰显了AI驱动产业变革的力量,助力中国制造业高质量发展。

  • 性能对标Gemini 2.5 Pro!蚂蚁开源新一代全模态大模型Ming-Flash-Omni 2.0

    今日,蚂蚁集团开源发布全模态大模型 Ming-Flash-Omni 2.0。 在多项公开基准测试中,该模型在视觉语言理解、语音可控生成、图像生成与编辑等关键能力表现突出,部分指标超越 Gemini 2.5 Pro,成为开源全模态大模型性能新标杆。 Ming-Flash-Omni 2.0 也是业界首个全场景音频统一生成模型,可在同一条音轨中同时生成语音、环境音效与音乐。 用户只需用自然语言下指令,即可对音色�

  • midjourney教程:如何midjourney生成逼真的人像照片 附22个好用的midjourney提示词

    Midjourney是一款强大的图像生成工具,它通过使用成千上万的摄影图片进行训练,具备了生成逼真图像的能力。这种技术不仅彻底变革了摄影艺术,也使得每个人都能够成为艺术家,在Midjourney的数字画布上创作出具有变革性想法的作品。景深浅3、汤姆小白猫写真提示词:垫图AbeautifulChinesegirl,sweetsmile,whiteskin,brightbigeyes,delicatemakeup,pinkpowderblusherandeyeshadow,darkbrownhaircombedintotw

  • 海信RGB-Mini LED电视“刷屏”央视 一文读懂它为何是高端首选

    海信RGB-Mini LED电视凭借“三维光色同控”技术,在高端市场脱颖而出。相比传统SQD-Mini LED的二维控光,海信实现了对红、绿、蓝三原色的独立精准控制,从光源端直接混色,避免了光晕、串色和色彩衰减问题。其搭载自研信芯AI画质芯片H7,支持超高分区控光,色彩表现更纯净,寿命更长,能效更高。选购时需认准真RGB方案,海信新品E8S是全能旗舰之选。

  • 新款RGB-Mini LED哪款值得买?大品牌更放心,4款口碑机型是首选

    春节是电视消费高峰期,高端机型尤其受欢迎。央视《消费主张》栏目推荐海信RGB-Mini LED电视,该技术采用红绿蓝三色背光直显,具备超高色域、色准和亮度,画质、能效和舒适度俱佳。相比传统单色背光方案,RGB-Mini LED色彩表现更优。选购时需注意真假辨别,符合“RGB真彩背光+光色同控算法”标准方为真品。海信已推出多款机型,覆盖不同场景需求,是春节换新的可靠选择。

  • midjourney教程:如何用Midjourney设计T恤图案 附50+midjourney提示

    注:本文图片均由midjourney生成Midjourney是一款出色的工具,可根据提示生成高质量图像,使其成为T恤设计师创作独特且引人注目的T恤设计的理想工具。站长之家将指导您完成制作提示的过程,以使用Midjourney设计T恤图形,这将创造出令人惊叹的T恤设计,让您与众不同。猜你喜欢:midjourney超全关键词室内设计师必看的31个midjourney提示含knolling摄影、信息图等25个midjourney提示案例m

今日大家都在搜的词: