AI视野：OpenAI开发者大会开放申请；微软在开发AI模型时泄露了38TB敏感数据；螺旋控制图像Illusion Diffusion爆火

2023-09-19 15:35 · 稿源：站长之家

👨‍💻💡🎯聚焦开发者

OpenAI开发者大会正式开始接受申请

2023年OpenAI开发者大会正式开始接受申请，计划于11月6日在旧金山举行，涵盖主题演讲、分组会议和晚间招待会。参会者需提交申请，门票费用为450美元，名额有限。主题演讲将通过直播方式提供。分组会议将涵盖API技术、AI产品开发最佳实践等内容。

申请地址:https://devday.openai.com/

站长之家提要:
1. OpenAI将举办首届开发者大会，汇聚开发者和团队，预览新工具和交流想法。
2. 参会者需提交申请，门票费用为450美元，名额有限，提前申请较有机会。
3. 主题演讲将通过直播提供，分组会议将探讨API技术和AI产品开发实践等议题。

微软在开发AI模型时泄露了38TB敏感数据

微软在GitHub上错误使用Azure平台的共享访问签名令牌（SAS），导致38TB的私人数据泄露，包括密码、密钥和内部消息。这次事件凸显了AI模型训练过程中的安全风险和挑战，需要更强的安全措施和协同工作来确保数据的安全性和隐私保护。

网络安全隐私 (4)

图源备注:图片由AI生成，图片授权服务商Midjourney

站长之家提要:
1. 微软在GitHub上分享AI模型训练数据时，错误使用了权限过于宽松的SAS令牌，导致数据泄露。
2. 数据泄露包括38TB的私人文件，其中包括密码、密钥和内部Microsoft Teams消息，威胁了数据的安全性。
3. 事件突显了SAS令牌的安全风险，强调AI模型训练过程需要更强的安全措施和监控以防止类似事件再次发生。

AI在玩一种很新的艺术!螺旋控制图像Illusion Diffusion爆火

AI创作了一种新的艺术形式，引发了近700万网友的围观，使用ControlNet技术，创造了一种螺旋图形的错觉图像，受到广泛关注。有网友甚至直接在Hugging Face上制作了——Illusion Diffusion，普通用户只要打开浏览器就能玩。

项目地址:https://huggingface.co/spaces/AP123/IllusionDiffusion

站长之家提要:
1、AI创作了一系列图像艺术作品，其中以棋盘和螺旋样式最为流行，吸引了数百万网友观看和点赞。
2、这些AI作品被认为具有错觉图形大师埃舍尔的感觉，展示了AI在图像创作领域的潜力。
3、使用ControlNet技术和开源AI文生图模型，网友可以尝试自己创作这种风格的图像，而且还可以应用在视频和其他领域。

Repilot开源:自动程序修复的高效补丁生成工具

Repilot是一款基于语义代码补全和大型语言模型的程序修复工具，能够自动分析代码错误并生成修复补丁，具有错误修复、智能补全、Docker支持等核心功能，旨在提高开发和维护效率。

项目地址:https://github.com/ise-uiuc/Repilot

站长之家提要:
1. Repilot可自动分析源码找出错误，并生成语义合理的补丁进行修复。
2. Repilot集成了语义代码补全引擎，保证补丁语义正确。
3. Repilot支持Docker部署，提供详尽文档，易于上手使用。

JoJoGAN:可一键生成艺术化面部图像的深度学习模型

JoJoGAN是一个深度学习模型，可将普通面部图像转化为艺术化作品，无需专业干预。它采用感知损失和身份损失的结合，确保生成图像保持个体特征。使用Nvidia T4GPU，平均耗时14秒，成本0.0077美元。但仅适用于面部图像，对GPU性能要求高。

项目地址:

https://www.aimodels.fyi/models/replicate/903681b6-e6d3-428c-b611-f6afb60b3d18

站长之家提要:
1. JoJoGAN是深度学习模型，将普通面部图像转化为艺术化作品，无需专业干预。
2. 它结合感知损失和身份损失，保持生成图像的个体特征。
3. 需要Nvidia T4GPU，仅适用于面部图像，对GPU性能要求高。

SyncDreamer:从单视图图像生成多视图一致图像以实现3D重建

SyncDreamer是一个端到端的框架，可以从单个视角的图像生成多视图一致的图像，以实现3D重建。

项目地址:https://github.com/liuyuan-pal/SyncDreamer

站长之家提要:
1. SyncDreamer包含一个diffusion模型和一个differentiable renderer，可以生成质量高、多视图一致的图像。
2. 先通过diffusion模型生成图像，再通过renderer生成对应的多视图，计算一致性损失进行优化。
3. SyncDreamer生成的图像可用于高质量3D重建，有助于推动3D生成技术的进步。

韩国AI研究机构出品!MagiCapture:个性化生成高分辨率肖像照片

韩国AI研究机构推出MagiCapture技术，实现高分辨率肖像照片的多概念个性化生成。该方法采用多概念定制，融合主题和风格概念，只需少量参考即可生成高分辨率肖像照片。

论文网址:https://arxiv.org/abs/2309.06895

站长之家提要:
1、MagiCapture采用多概念定制方法，融合主题和风格概念，生成高质量个性化肖像照。
2、研究人员提供新的注意力重新聚焦损失和即时学习策略，明显优于基线方法。
3、MagiCapture代表肖像生成领域的重要技术进步，为用户提供更便捷的个性化肖像生成。

📰🤖📢AI新鲜事

B站UP主手作AI男士婚纱引围观视频播放量超43万

一句话概括:B站UP主受AI男士婚纱照启发，策划一个月成功制作了一套男士婚纱，视频展示了设计过程，播放量超过43万。

站长之家提要:
1. UP主在女士婚纱基础上改造，加入了露腰设计，使用蕾丝和网纱呼应上衣，创新以网纱替代裙摆。
2. 男士婚纱在现实不常见，需要大胆创新，难度较高，UP主克服了种种困难成功制作。
3. 视频在B站上引发热议，播放量超过43万，许多网友纷纷分享喜好。

小红书博主用AI生成电商模特图赚到2000

小红书博主“知影Studio”使用AI技术为客户生成电商模特形象照，仅用一个下午的时间就完成了6-7套照片创作，质量较高，为电商领域开辟了新的应用场景。

站长之家提要:
1、博主用AI工具为客户快速生成电商形象照片，只用一个下午完成6-7套照片。
2、AI生成的电商模特图像效率高、质量较好，难以找出破绽。
3、小红书用户希望看到更丰富、更实用的AI生成电商内容，有利于电商领域创新。

Nvidia第二季度交付900吨AI芯片 Meta可能是最大单客户

Nvidia在第二季度交付了900吨AI芯片，其中大部分可能供应给Meta，引发了市场的广泛关注。Omdia的研究表明，对Nvidia AI芯片的需求激增，导致服务器平均价格上涨30%，并且市场规模预测将增长8%。

英伟达，人工智能，芯片，AI，NVIDIA GH200 Grace Hopper

站长之家提要:
1. Nvidia第二季度向客户交付了900吨H100AI芯片。
2. 根据Omdia报告，Nvidia AI芯片需求激增，服务器平均价格上涨30%。
3. 尽管AI硬件需求增加，但AI实际采用增长相对较慢，未来领域特定AI模型将成为重点。

MSN删除了抄袭、乱编的AI文章，但问题仍未解决

MSN刊登了一篇似乎由人工智能生成的文章，涉及前NBA球员Brandon Hunter的死讯，后来被撤下。这篇文章被指责抄袭TMZ Sports博客，并且内容混乱不堪，由一家名为Race Track的出版社制作。尽管MSN删除了这篇文章，但Race Track仍然发布一连串难以理解的文章，MSN继续转载。这问题尚未得到解决。

AI机器人玩游戏

图源备注:图片由AI生成，图片授权服务商Midjourney

站长之家提要:
1. MSN新闻发布了一篇似乎由人工智能生成的文章，内容涉及前NBA球员Brandon Hunter的消息，后来被指责抄袭并撤下。
2. 这篇文章由名为Race Track的出版社制作，内容混乱不堪，很可能抄袭了TMZ Sports博客的内容。
3. 虽然MSN删除了有争议的文章，但Race Track继续发布难以理解的文章，而MSN则继续转载，凸显了内容审查方法的缺失问题。

ChatGPT竞争对手Writer，获得1亿美元融资

Writer获得1亿美元B轮融资，主要面向企业市场，提供类似于ChatGPT的功能，注重数据安全和可解释性。

站长之家提要:
Writer的融资由ICONIQ Growth领投，已吸引知名企业投资，收入增长迅速。
Writer的核心技术是Palmyra大语言模型，已在不同领域取得成功。
Writer提供多种功能，包括文本生成和数据安全，适用于各种主流业务场景。

腾讯AI新专利可判断文件对应情绪

腾讯近日获得了一项关于利用AI处理文本情感的专利。该专利提出了一种方法，可以根据用户查看文档时的情绪反馈，来判断并展示文档的情绪倾向，从而让用户对文档内容有更明确的预判。

微信截图_20230919151936.png

站长之家提要:
1. 专利可以获取用户查看文档时的情绪数据，并展示文档的情绪可视化图像。
2. 根据用户情绪数据实时更新并展示情绪可视化图像。
3. 通过情绪可视化图像，用户可以判断文档内容的情绪倾向，提升体验。

英国公布AI监管原则开发者须对输出内容负责

英国竞争与市场管理局提出新的AI监管标准，强调开发者对AI输出内容负责，关注问责和透明度，英国政府致力于推动健康发展的AI技术。

站长之家提要:
1、英国竞争与市场管理局引领AI监管，要求开发者负责AI系统输出内容，关注问责和透明度。
2、英国政府计划成为全球AI产业和监管的领导者，将举办全球AI峰会，同时放宽AI文本和数据的版权限制，吸引AI企业入驻。
3、全球范围内，AI监管成为热议话题，各国在制定AI法规和原则方面积极行动，旨在平衡创新和消费者权益。

英伟达与 Anyscale 合作

英伟达与Anyscale合作，旨在提高大型语言模型和生成式AI应用的开发效率，解决处理器需求增加和资源受限的问题。

图片来自NVIDIA

站长之家提要:
1. 大型语言模型在生成式AI工具中需要更多处理器，但处理器价格高昂且供应有限，云资源也无法完全解决扩展规模的问题。
2. 英伟达将其AI技术引入Anyscale平台，支持流行的开源模型嵌入到应用程序中，并提供自动扩展推理功能，提高性能。
3. Anyscale的Ray框架是全球增长最快的可扩展计算统一框架，与英伟达的合作旨在加速大型语言模型和生成AI应用的开发，提供前所未有的速度和效率。

甲骨文发布语音AI助手，助力医疗保健领域

甲骨文公司发布语音生成式AI助手，旨在改善医疗保健领域的工作流程，将整合到电子健康记录解决方案中，提供多模态支持，自动化管理医疗记录，帮助医护人员提高患者护理质量。

AI 医疗 (2)

图源备注:图片由AI生成，图片授权服务商Midjourney

站长之家提要:
1. 甲骨文推出生成式AI助手，解决医疗保健领域的工作效率和人员短缺问题。
2. 助手通过文本或语音命令工作，提供多模态支持，改善电子健康记录的管理和患者护理流程。
3. 助手还提供患者自助服务体验，可用于安排约会或支付账单，预计在未来12个月内全面推出以改善医护工作流程。

人工智能可以检测痴呆症了!有望改善治疗效果

最近宾夕法尼亚州盖辛格健康系统的研究发现，人工智能工具在检测未确诊痴呆症方面具有潜在有效性，提供了改善早期诊断和治疗的新希望。这项研究表明AI在早期痴呆症识别中准确性显著，可为提高生活质量和治疗效果提供支持。

核磁共振医疗 (2)

图源备注:图片由AI生成，图片授权服务商Midjourney

站长之家提要:
1. 宾夕法尼亚州盖辛格健康系统的研究发现，AI算法在早期痴呆症的诊断中表现出卓越准确性。
2. 早期痴呆症的诊断对干预和治疗至关重要，传统方法通常耗时且困难。
3. AI诊断工具有望提高痴呆症患者的生活质量，加速诊断速度和准确性在临床实践中的应用。

🤖📈💻💡大模型动态

OpenAI多模态AI系统GPT-Vision即将推出与谷歌Gemini竞争

OpenAI即将推出GPT-Vision多模态AI系统，与谷歌Gemini形成直接竞争。GPT-Vision可支持图像和文本输入，实现视觉能力增强。OpenAI加速商业化布局，意在抢占先机。业内认为OpenAI与谷歌竞争将推动行业技术进步。

gpt-4，OpenAI，ChatGPT Plus，人工智能

站长之家提要:
1、OpenAI将推出GPT-Vision多模态AI系统，与谷歌Gemini直接竞争
2、GPT-Vision支持图像和文本输入，实现视觉能力增强
3、OpenAI与谷歌竞争有利于行业技术进步

多模态大模型MMICL霸榜支持文本图像视频输入

北京交通大学等机构推出多模态大模型MMICL，它支持文本、图像、视频三种模态混合输入，在多项评测中表现抢眼，已开源两个版本，有望成为多模态领域新宠。

项目地址:https://github.com/HaozheZhao/MIC

站长之家提要:
1. MMICL支持文本、图像、视频三种模态混合输入，在多项多模态能力评测中表现突出。
2. MMICL采用两阶段训练，可实现“现学现卖”，有效缓解视觉语言模型中的语言偏见。
3. MMICL已开源可商用的Flan版和仅科研用的Vicuna版，都发布在GitHub上。

🤖📱💼AI应用

字节跳动旗下云服务火山引擎数智平台VeDI发布AI助手

字节跳动旗下云服务火山引擎在数据驱动科技峰会上推出了数智平台VeDI的AI助手，通过接入大语言模型，可以帮助企业提升数据处理和查询分析效率，即使不懂编程的员工也可以进行业务运营数据的分析。

站长之家提要:
1. 火山引擎推出VeDI数智平台的AI助手
2. AI助手接入大语言模型，提升数据处理效率
3. 即使不会编程也可以进行业务数据分析

谷歌AI聊天机器人 Bard 新增Gmail等谷歌应用插件

谷歌AI聊天机器人Bard最近更新，新增对Gmail、Docs、Drive等谷歌应用的插件支持，可以实时获取谷歌服务信息并与用户交互。

微信截图_20230919160304.png

站长之家提要:
1. Bard支持应用插件，可以获取谷歌服务实时数据，如地图、YouTube等。
2. 用户可以点击插件图标或输入前缀@调用插件与Bard交互。
3. Bard新增公共链接分享功能，用户可以分享对话给他人在自己设备上继续交互。

Chat Video:用GPT分析和总结视频

ChatVideo是基于人工智能的视频分析和管理工具，利用其独特的AI技术，能够通过语音识别快速转录视频内容成文字，自动生成视频大纲和总结，并提供强大的问答功能，同时还具备多种可视化功能，提高了视频的可用性，使用户能够高效学习和管理视频。

站长之家提要:
1. ChatVideo利用AI技术实现高效视频管理，包括语音识别、自动生成大纲和总结、强大问答功能等。
2. 用户能够通过文字稿件快速定位视频内容，无需重复播放，提高学习效率。
3. 多种可视化功能提升视频理解，用户可选择不同模式获得最佳体验。

（举报）

相关推荐
大家在看

关键词：

OpenAI

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
微软在开发AI模型时泄露了38TB敏感数据

微软近期的数据泄露事件凸显了AI模型训练过程中的安全风险和挑战。这一事件发生在GitHub公共存储库上，由于错误使用Azure平台的共享访问签名令牌，导致了38TB的私人数据泄露。类似微软的事件变得越来越难以监控和避免，因此需要更强的安全措施和协同工作来确保数据的安全性和隐私保护。

微软 AI模型
螺旋形状控制网图像Illusion Diffusion：Hugging Face空间的创新之光

一套基于螺旋形状的控制网图像在网络上引发了热潮。这种独特的螺旋形状风格成为了网友们关注的焦点令人惊讶的是，这个风格是由HuggingFace空间创造出来的。HuggingFace空间的这种创新尝试，不仅展示了其在图像设计和处理方面的强大实力，也进一步推动了相关领域的发展和创新。

IllusionDiffusion
OpenAI开发者大会正式开始接受申请

OpenAI刚刚宣布，他们现在接受申请参加他们的第一个开发者大会。DevDay计划于2023年11月6日在旧金山举行，您可以点此申请。但如果您正在积极开发生成式AI应用程序，分组会议和与OpenAI工程师的交流可能非常有价值。

OpenAI AI头条
T2I扩散模型PIXART-α：图像生成质量媲美Stable Diffusion

文本到图像生成模型如DALLE2、Imagen和StableDiffusion的发展，开启了逼真图像合成的新时代。这不仅对图片编辑、视频制作、3D素材创建等领域产生了深远影响为研究社区和企业提供了许多下游应用的机会。控制功能:PIXART-α还提供了控制功能，允许用户生成定制图像，精确修改物体颜色等，以满足特定需求。

PIXART-α 扩散模型 AI头条
Deci AI推出8.2亿参数的文本到图像潜在扩散模型DeciDiffusion 1.0

DeciAI最近推出了DeciDiffusion1.0，这是一项令人振奋的创新，旨在解决文本到图像生成领域的挑战。将文本描述转化为栩栩如生的图像一直是人工智能领域的难题，因为这涉及到自然语言理解和视觉内容创建之间的巨大差距。随着研究人员继续推动AI能够实现的界限，我们可以期待进一步的突破，使我们更接近一个世界，其中文本无缝地转化为引人入胜的图像，从在各个行业和领�

DeciDiffusion AI头条
荐AI视野：英特尔首款AI PC处理器发布；腾讯开源StableDiffusion插件LightDiffusionFlow；百度发布医疗大模型；妙鸭相机推出免费体验版

DeepMind发布AlphaMissense模型，能预测基因错义突变是否致病，提升近千倍于人类专家，成功分类7100万突变中89%的致病性，加强遗传病诊断和新致病基因发现。论文地址:https://www.science.org/doi/10.1126/science.adg7492百度发布医疗大模型“灵医大模型”百度发布国内首个“产业级”医疗大模型——灵医大模型，旨在推�

英特尔
腾讯开源StableDiffusion工作流保存插件LightDiffusionFlow

腾讯宣布开源LightDiffusionFlow，LightDiffusionFlow是一个开源插件，基于AI绘画开源平台StableDiffusionwebUI开发来。它可以帮助用户一键保存和复现SD绘画工作流，包括模型、提示词、垫图和其他第三方插件的参数设置。对于SD初学者来说，使用Flow文件可以快速上手SD，降低学习和使用门槛;对于SD进阶者来说，可以保存优质的工作流并快速复用，减少操作成本，并传播AI绘画能力;对于企业团队来说，可以建立可复用的AI绘画工作流，快速建立团队的AI绘画能力，实现降本增效。
美图自研AI视觉大模型MiracleVision奇想智能3.0版发布

美图公司在其15周年生日会上发布了自研AI视觉大模型MiracleVision3.0版本，并将全面应用于旗下的影像与设计产品。这一大模型将助力电商、广告、游戏、动漫、影视五大行业，提高工作流效率。美图公司还公布了其影像生产力工具的最新数据，包括AI视觉创作工具“WHEE”生成数已超过550万张，AI口播视频工具“开拍”月活跃用户数已突破35万，桌面端AI视频编辑工具“WinkStudio”已累计服务近10万名视频创作者，AI商业设计工具“美图设计室”正帮助近百万中小电商卖家降本增效，AI修图工具“RoboNeo”每天帮助近万名用户自动修图，比传统修图效率提升35%，AI数字人生成工具“DreamAvatar”已上线并提供“AI演员”数字人服务。
2023开放数据中心大会，超聚变发布FusionPoD for AI整机柜液冷服务器

9月13日至14日，由开放数据中心委员会主办的“2023开放数据中心大会”在北京国际会议中心举行。超聚变数字技术有限公司推出FusionPoDforAI整机柜液冷服务器，适用于大规模、超大规模的模型训练、推理等AI场景。超聚变秉承开放创新理念，协同产业链上下游、科研院所、标准协会等共同推动液冷技术的持续迭代和规模化商用进程，为客户提供绿色智能算力与服务。
AltDiffusion：提供多语言文本到图像的解决方案

AltDiffusion是一种创新的多语言文本到图像的扩散模型，旨在解决现有文本到图像模型仅支持有限语言的问题。它支持18种不同语言，通过多种巧妙的训练技巧，如知识蒸馏和与已经预训练的仅支持英语的模型的结合，以及概念对齐和质量提升等步骤，实现了多语言文本到图像的转化。这一研究为多语言人工智能领域的进一步研究和应用提供了有力支持。

AltDiffusion 扩散模型

今日大家都在搜的词：

热文

3 天
7天

AI视野：OpenAI开发者大会开放申请；微软在开发AI模型时泄露了38TB敏感数据；螺旋控制图像Illusion Diffusion爆火

今日大家都在搜的词：

热文

站长商机