首页 > 业界 > 关键词  > Midjourney最新资讯  > 正文

AI日报:MJ推模型个性化功能;ComfyUI完成SD3 Medium模型适配;字节上线AI交友“小黄蕉”;微信输入法内测AI功能

2024-06-12 15:39 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、Midjourney推出模型个性化功能

Midjourney最近推出了一项创新的模型个性化功能,允许用户根据审美偏好微调MJ模型,使生成的图像更贴近个人喜好。个性化模型通过分析用户喜欢的图片来实现,学习用户独特审美,满足用户品味。用户需对至少 200 张图片进行评分或点赞,启用个性化功能后,在提示后添加特定代码分享个性化效果。

image.png

【AiBase提要:】

🎨 模型个性化功能允许用户根据审美偏好微调MJ模型,使生成图像更符合个人喜好。

🔍 个性化模型通过分析用户过往喜欢的图片,学习用户独特审美,提高生成图像准确性。

💡 用户需对至少 200 张图片进行评分或点赞,启用个性化功能后,在提示后添加特定代码分享个性化效果。

详情链接:https://www.midjourney.com/rank

2、为了迎接即将开源的SD3 Medium 模型 ComfyUI已提前完成适配

SD3Medium 模型即将开源,为了迎接这一重要时刻,ComfyUI已经提前进行了适配工作,做好了迎接新模型的准备。届时,大家生图可以体验更真实的质感,更好的构图,更优的性能以及更出色的微调能力。

QQ截图20240611174410.jpg

【AiBase提要:】

📈 SD3 Medium 模型即将开源,ComfyUI已完成提前适配工作。

🖼️ SD3 Medium 在图像生成方面取得显著进步,能够生成细节丰富且高度逼真的图像。

💡 SD3 Medium 在生成高质量、细节丰富的图像方面具备强大能力。

详情:

https://github.com/comfyanonymous/ComfyUI/commit/8c4a9befa7261b6fc78407ace90a57d21bfe631e

3、微信输入法内测AI功能 只要按这个键就可以获取AI回答

微信输入法内测版本新增AI助手功能,按“=”获取AI生成回答。emoji和颜文字推荐支持。增强对时间、日期输入格式支持。

image.png

【AiBase提要:】

🤖微信输入法新增AI助手功能,按“=”获取AI生成回答。

🤖更新加强对emoji和颜文字的支持,增强对时间、日期输入格式的支持。

🤖目前内测版本仅面向Windows用户,iOS、Android和Mac平台可能会推出。

4、字节上线AI虚拟交友聊天产品小黄蕉 可生成照片,接近真人对话场景

近日,一款名为“小黄蕉”(英文名Chatwiz)的AI虚拟交友聊天产品上线,其特点是能够生成照片,且对话过程非常接近真人。经查证,该产品的工商主体为北京臻鼎科技有限公司(番茄小说),而其背后的实际控制者是字节跳动公司。

QQ截图20240611160830.jpg

【AiBase提要:】

⭐ 小黄蕉是AI虚拟交友聊天产品,能生成照片,对话接近真人。

⭐ 字节跳动积极布局AI大模型,推出多款AI产品和服务。

⭐ “小黄蕉”展现了字节跳动在AI应用领域的持续探索和创新。

5、科大讯飞:将于 6 月 27 日发布讯飞星火V4.0 展示最新智能语音技术

科大讯飞将于 6 月 27 日发布讯飞星火V4.0,展示最新的端到端智能语音技术成果,包括一句话复刻、高噪音场景语音识别和多方言多语种免切换功能。刘庆峰透露,科大讯飞在全双工技术和超拟人合成技术方面处于国际领先水平。未来,科大讯飞将专注于远场高噪音多人说话场景、高表现力个性化场景等领域的研发。

【AiBase提要:】

🚀 讯飞星火V4. 0 将展示最新的端到端智能语音技术成果,包括一句话复刻、高噪音场景语音识别和多方言多语种免切换功能。

💡 科大讯飞在全双工技术和超拟人合成技术方面达到国际领先水平。

🔮 未来,科大讯飞将专注于远场高噪音多人说话场景、高表现力个性化场景等领域的研发。

6、苹果宣布新AI功能后股价创历史新高

苹果公司股价周二收盘时上涨超过7%,创下历史新高。这次反弹为苹果今年的表现带来了一线希望,展示了市场对苹果新的人工智能功能的积极态度。

image.png

【AiBase提要:】

📈 苹果股价周二上涨超过7%,创历史新高,市值有望达到3. 18 万亿美元,仅次于微软。

📱 新的人工智能功能提高了苹果设备的吸引力,包括改进的 Siri 虚拟助手和多项AI功能。

💡 开发者活动后,分析师上调对苹果股票的目标价,预计新功能将刺激秋季新iPhone系列的购买。

7、Follow-Your-Emoji:通过捕捉人物表情变化生成表情丰富的动画

Follow-Your-Emoji是一项突破性技术,通过提取视频中人物的面部特征生成全新的面部动画。这项技术精确捕捉面部特征和瞳孔点,排除面部轮廓干扰,实现更自然、更生动的动画效果。应用广泛,娱乐、教育、商业领域皆可受益。

image.png

【AiBase提要:】

👤 用户提供照片,技术生成视频动画,捕捉微妙表情变化。

🔒 身份保持,参考头像身份特征得到保留,不会丢失。

😊 表情丰富,生成各种表情,包括瞳孔运动,让动画更生动、真实。

详情链接:https://top.aibase.com/tool/follow-your-emoji

8、在线AI图像编辑器Freepik Designer

Freepik Designer是一款创新的在线AI图像编辑器,为用户提供了简单易用的设计工具,无需专业设计技能即可快速上手。它的AI工具集成让设计过程更高效,同时提供丰富的模板库,满足不同设计需求。

image.png

【AiBase提要:】

🎨 简单易用的设计工具,无需专业设计技能即可快速上手

🖼️ 提供丰富的模板库,满足不同设计需求

💡 内置AI工具集成,提升设计效率和质量

详情链接:https://top.aibase.com/tool/freepik-designer

9、埃隆・马斯克撤回对 OpenAI 的诉讼

埃隆・马斯克撤回了对 OpenAI 的诉讼,指控其违约。马斯克认为 OpenAI 放弃了非营利性使命,转向商业利益。OpenAI 否认指控,称其“不连贯”和“荒谬”。

【AiBase提要:】

🔍 埃隆・马斯克撤回对 OpenAI 的诉讼。

💡 马斯克指责 OpenAI 放弃非营利性使命,转向商业利益。

🔒 OpenAI 否认指控,称其“不连贯”和“荒谬”。

10、Yandex推出的开源工具YaFSDP 突破LLM训练效率瓶颈

Yandex开源的YaFSDP工具为全球AI社区带来了突破性的LLM训练优化方法,显著提升训练速度,节省大量GPU资源,使自主LLM训练更具可行性。Yandex承诺持续贡献全球AI社区发展,YaFSDP开源是其承诺的体现。

【AiBase提要:】

✨ YaFSDP是Yandex开源的高效大型语言模型训练优化方法,可提升LLM训练速度26%。

💡 YaFSDP专注于优化GPU通信效率和内存使用,在训练参数规模达到 300 亿至 700 亿时表现出色。

🌟 采用YaFSDP训练 700 亿参数模型可节省约 150 台GPU资源,成本节约可达 50 万至 150 万美元。

11、速度提高 410 倍!TiTok仅需 32 个token就能重建与生成图片

近期,生成模型的发展突显了图像标记化在高分辨率图像高效合成中的关键作用。TiTok是基于Transformer的一维标记化框架,将图像标记化为一维潜在序列,极大提高了生成效率和质量。它在处理高分辨率图像时表现出色,生成速度显著提高,同时保持高质量样本输出。

image.png

【AiBase提要:】

⚙️ 图像token化降低计算需求,增强生成效率和有效性。

🔍 TiTok将图像标记化为一维潜在序列,用少至 32 个离散token表示256× 256 图像。

💡 TiTok在ImageNet基准测试中表现优异,生成速度提高 410 倍,同时保持高质量样本输出。

12、MIT开发新算法DenseAV:通过观看视频学习语言含义

在MIT开发的新算法DenseAV中,研究人员利用机器理解动物的交流方式,通过观看视频学习语言的含义。该算法能够无监督学习单词的含义和声音的位置,实现跨模态连接的自然区分。团队希望应用于理解新语言和发现不同信号之间的模式关联。

image.png

【AiBase提要:】

🧠 DenseAV是双编码器接地架构,学习高分辨率、语义意义和视听对齐的特征。

🔍 无监督学习发现单词含义和声音位置的关联,自动区分语言和声音。

🌐 在跨模态检索方面优于以前的模型ImageBind,应用于学习大量视频和理解新语言。

详情链接:https://top.aibase.com/tool/denseav

13、让AI更合乎伦理:Source.Plus 提供高质量AI训练数据

Spawning 致力于为艺术家提供更多对其作品在线使用的控制权,Source.Plus 项目推出的数据集包含近 4000 万个公有领域图片和采用 Creative Commons CC0 许可的图片,为AI模型的训练提供高质量的数据。该平台为艺术家和创作者提供了更精细的作品使用权限管理,为AI技术的发展和应用注入新活力。

image.png

【AiBase提要:】

🔍 数据搜索与整理:用户可快速搜索各种媒体数据,整理标注以满足训练需求。

🌟 高质量训练数据:经筛选审核的数据保证安全质量,合法同意使用。

💡 应用场景广泛:适用于各种AI模型训练,提高准确性和鲁棒性。

详情链接:https://top.aibase.com/tool/source-plusSource.Plus

14、Mistral AI获得6. 4 亿美元B轮融资

Mistral AI近期宣布获得6. 4 亿美元的B轮融资,估值提升至近 60 亿美元。这一轮融资由General Catalyst领投,多家知名投资机构和公司参与,加速了Mistral在人工智能领域的发展和国际商业化进程。

【AiBase提要:】

🚀 Mistral AI获得6. 4 亿美元B轮融资,估值提升至近 60 亿美元。

💡 General Catalyst领投,多家知名投资机构和公司参与,加速了Mistral在人工智能领域的发展和国际商业化进程。

💰 生成式AI市场预计未来十年内将以每年42%的复合增长率达到1. 3 万亿美元,Mistral此次融资将加速商业化进程,拓展分销渠道。

15、自回归图像生成模型LlamaGen

LlamaGen 是一项颠覆性创新,展示了即使在没有视觉信号归纳偏差的情况下,自回归模型也能实现领先的图像生成性能。该技术为图像生成领域带来新可能性,为未来研究提供新思路。

image.png

【AiBase提要:】

🔑 LlamaGen 提出了具有 16 倍降采样比、0. 94 的重建质量和97% 码书利用率的图像分词器,在 ImageNet 基准测试上表现优异。

🚀 LlamaGen 推出了一系列类别条件图像生成模型,范围从111M到3.1B参数,在 ImageNet256× 256 基准测试上取得了2. 18 的 FID,超越了流行的扩散模型。

💡 LlamaGen 推出了文本条件图像生成模型,具有775M参数,在 LAION-COCO 的两阶段训练后,展现出高质量的美学图像和优秀的视觉质量与文本对齐性能。

详情链接:https://top.aibase.com/tool/llamagen

16、未经同意 人工智能利用儿童照片引发隐私安全挑战

这篇文章揭露了人工智能图像生成器在训练数据集中未经允许使用巴西儿童个人照片的严重问题,引发了儿童隐私和安全的严峻挑战。文章呼吁政府和科技公司承担责任,保护儿童数据不被滥用,制定相应的保护措施。

【AiBase提要:】

🔒 未经允许使用儿童照片:人工智能图像生成器训练数据集中存在大量未经允许使用的巴西儿童个人照片,涉及儿童整个童年时期的珍贵片段。

⚠️ 儿童隐私风险:照片中包含儿童的姓名和位置信息,使其身份易被追踪,可能导致欺凌、钓鱼等风险,甚至生成不当内容。

⚖️ 呼吁保护措施:人权组织呼吁政府明确禁止未经允许使用儿童个人数据训练AI系统,加强儿童数据保护,设计追责途径。

举报

  • 相关推荐
  • “无限量”供应Claude,就是AI IDE们的百亿补贴

    Anthropic于2025年7月28日宣布,将从8月28日起对Claude Code工具新增每周调用限额——因为少数重度用户全天候高频使用,一次使用成本甚至高达数万美元,远远超过普通订阅预期。 同样在上个月,Cursor曾因其“I’ll keep it unlimited”的Pro收费模式悄然变更为计算tokens限制,导致大量用户抱怨“实际上并非无限”,纷纷在社群中吐槽,迫使公司CEO出面道歉、甚至给出退款补偿。 这两�

  • 电子证件(Digital ID)的全球信任度全景:亚洲、中东与非洲领先,欧美市场滞后

    Checkout.com最新全球调研报告显示,不同地区对电子证件(digital ID)的接受度存在显著差异。亚洲、中东和非洲消费者对电子证件和生物识别认证表现出高度信任,而欧洲和北美则态度谨慎。AI电商代理的兴起进一步凸显了数字身份验证在交易中的重要性。报告强调,建立数字信任对全球商业发展至关重要,需行业和政策制定者优先考虑数字身份管理方式。

  • REDMI最强旗舰!产品经理:REDMI K90系列是最优解

    有博主参加了下一代REDMI K系列的讨论会,大家对REDMI K系列提供了三大建议,一是加强影像,二是加强性能和电池续航,三是加强外观设计和优化系统。 对此,REDMI美女产品经理胡馨心表示,REDMI K90系列会给出最优解。 据爆料,REDMI K90系列将在今年10月登场,包含K90和K90 Pro两款,其中K90搭载高通骁龙8 Elite,K90 Pro搭载高通骁龙8 Elite 2。 其中K90 Pro搭载的骁龙8 Elite 2是高通最强�

  • 徒步解放双手!Telesin泰讯磁吸挂脖支架+DJI OSMO 360实测:风景自动记录

    Telesin泰迅推出专为大疆OSMO 360设计的徒步拍摄系统,包含三大核心组件:1)可拆卸挂脖支架采用磁吸接口,5秒内完成拆装,配备透气网面材质降低垂直震动;2)背包固定组件适配主流登山包,硅胶减震层达3mm厚度,支持8个方位旋转;3)多功能延长杆采用碳纤维管体,伸缩范围35-150cm。该系统针对1273名户外用户调研的三大痛点设计:设备稳定性(68.2%提及率)、快速视角切换(57.4%)和轻量化(82.1%)。30名测试者反馈显示,83%认可总重<550g的设计,76%肯定行走拍摄稳定性。产品即日起线上线下同步发售,提供18个月主体保修服务。

  • REDMI产品经理带着神秘新品出差:米粉都在猜是K90

    REDMI产品经理胡馨心闪现小米上海总部,她带着神秘新品来上海出差。不少米粉对神秘新品”表示好奇,都在猜测是不是REDMI K90系列产品。 据爆料,REDMI将在10月推出K90系列,包含K90和K90 Pro两款机型,其中REDMI K90 Pro首批搭载高通骁龙8 Elite 2旗舰平台,同时配备潜望长焦,这是K系列首款潜望长焦旗舰。

  • REDMI Note 15 Pro+首搭自研澎湃T1S芯片

    REDMI官方今日正式宣布,Note15系列将于8月21日(周四)19:00全球首发。作为该系列性能旗舰,Note15Pro首次搭载小米自研澎湃T1S信号增强芯片,这款与K80Pro同源的通信芯片,将中高频蜂窝通信性能提升最高37%,Wi-Fi和蓝牙性能同步增强16%,官方用"信号强到离谱"形容其通信表现。 据实测数据,澎湃T1S芯片在人流密集的商圈、车站等场景下,网络抢通能力显著提升;在地下车�

  • 王腾吃虫子:为了REDMI Note 15的新品宣传 我豁出去了

    REDMI总经理王腾表示,前几天跟德爷见面,他给我带了一盒竹节虫做早餐,我说我吃过早饭了,他还是硬要我尝了一个,为了REDMI Note 15系列的新品宣传,我也是豁出去了,大家有机会自己尝一下。 这次REDMI Note 15 Pro系列邀请荒野求生专家,地表最强实战之王德爷(埃德斯塔福德)挑战真实生活中更复杂、更高频、更极限的场景,共同见证手机实战品质之王的诞生。

  • 可赶上这波了!iOS用户“一键补课”了Mistplay的新功能

    在2023 ChinaJoy展会上,Mistplay凭借其独特的"玩赚"模式成为BTOB展区热门平台。该平台通过游戏时长激励玩家,同时为开发者提供高质量用户,已覆盖全球九大应用市场,累计安装超3500万次。Mistplay近期推出iOS版本,新增锦标赛、益智问答等功能,并创新推出LoyaltyPlay功能,为非游戏应用搭建激励桥梁。其核心AI引擎"Helios"能精准匹配用户与游戏,提升用户留存率和LTV。中国区负责人彭超楠在展会上分享了"忠诚度营销"理念,为游戏出海提供新思路。双平台布局使Mistplay优势更加突出,成为开发者提升用户留存的重要合作伙伴。

  • REDMI Note 15 Pro+将首发第四代骁龙7s

    今日,高通正式推出第四代骁龙7s移动平台,该平台采用先进的4nm制程工艺,集成性能显著提升的Kryo CPU与Adreno GPU,可支持WFHD+分辨率下144Hz高刷新率屏幕,为用户带来细腻流畅的视觉体验。据官方测试数据,其CPU性能较前代提升7%,GPU图形渲染速度同步增长7%,被业界视为第三代骁龙7s的强化版本。 在AI算力方面,第四代骁龙7s通过端侧AI引擎实现了影像功能的突破性升级。平台

  • 三星全球首发Micro RGB,为高端显示技术树立标杆

    三星电子发布全球首款Micro RGB显示技术,采用小于100微米的微型RGB LED阵列,实现精准独立控光。该技术突破性地应用于115英寸超大屏幕,带来100% BT.2020色域覆盖和VDE认证的精准色彩表现。搭载AI引擎可实时优化画质,配备防眩光技术和超薄金属机身。产品集成Vision AI系统,支持生成式AI语音助手Bixby,并配备三星Knox安全方案,提供7年Tizen系统更新支持。这款产品重新定义了高端显示标准,即将登陆中国市场。

今日大家都在搜的词: