首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

AI视野:OpenAI开发者大会开放申请;微软在开发AI模型时泄露了38TB敏感数据;螺旋控制图像Illusion Diffusion爆火

2023-09-19 15:35 · 稿源:站长之家

👨‍💻💡🎯聚焦开发者

OpenAI开发者大会正式开始接受申请

2023年OpenAI开发者大会正式开始接受申请,计划于11月6日在旧金山举行,涵盖主题演讲、分组会议和晚间招待会。参会者需提交申请,门票费用为450美元,名额有限。主题演讲将通过直播方式提供。分组会议将涵盖API技术、AI产品开发最佳实践等内容。

image.png

申请地址:https://devday.openai.com/

站长之家提要:

1. OpenAI将举办首届开发者大会,汇聚开发者和团队,预览新工具和交流想法。

2. 参会者需提交申请,门票费用为450美元,名额有限,提前申请较有机会。

3. 主题演讲将通过直播提供,分组会议将探讨API技术和AI产品开发实践等议题。

微软在开发AI模型时泄露了38TB敏感数据

微软在GitHub上错误使用Azure平台的共享访问签名令牌(SAS),导致38TB的私人数据泄露,包括密码、密钥和内部消息。这次事件凸显了AI模型训练过程中的安全风险和挑战,需要更强的安全措施和协同工作来确保数据的安全性和隐私保护。

网络安全 隐私 (4)

图源备注:图片由AI生成,图片授权服务商Midjourney

站长之家提要:

1. 微软在GitHub上分享AI模型训练数据时,错误使用了权限过于宽松的SAS令牌,导致数据泄露。

2. 数据泄露包括38TB的私人文件,其中包括密码、密钥和内部Microsoft Teams消息,威胁了数据的安全性。

3. 事件突显了SAS令牌的安全风险,强调AI模型训练过程需要更强的安全措施和监控以防止类似事件再次发生。

AI在玩一种很新的艺术!螺旋控制图像Illusion Diffusion爆火

AI创作了一种新的艺术形式,引发了近700万网友的围观,使用ControlNet技术,创造了一种螺旋图形的错觉图像,受到广泛关注。有网友甚至直接在Hugging Face上制作了——Illusion Diffusion,普通用户只要打开浏览器就能玩。

image.png

项目地址:https://huggingface.co/spaces/AP123/IllusionDiffusion

站长之家提要:

1、AI创作了一系列图像艺术作品,其中以棋盘和螺旋样式最为流行,吸引了数百万网友观看和点赞。

2、这些AI作品被认为具有错觉图形大师埃舍尔的感觉,展示了AI在图像创作领域的潜力。

3、使用ControlNet技术和开源AI文生图模型,网友可以尝试自己创作这种风格的图像,而且还可以应用在视频和其他领域。

Repilot开源:自动程序修复的高效补丁生成工具

Repilot是一款基于语义代码补全和大型语言模型的程序修复工具,能够自动分析代码错误并生成修复补丁,具有错误修复、智能补全、Docker支持等核心功能,旨在提高开发和维护效率。

image.png

项目地址:https://github.com/ise-uiuc/Repilot

站长之家提要:

1. Repilot可自动分析源码找出错误,并生成语义合理的补丁进行修复。

2. Repilot集成了语义代码补全引擎,保证补丁语义正确。

3. Repilot支持Docker部署,提供详尽文档,易于上手使用。

JoJoGAN:可一键生成艺术化面部图像的深度学习模型

JoJoGAN是一个深度学习模型,可将普通面部图像转化为艺术化作品,无需专业干预。它采用感知损失和身份损失的结合,确保生成图像保持个体特征。使用Nvidia T4GPU,平均耗时14秒,成本0.0077美元。但仅适用于面部图像,对GPU性能要求高。

image.png

项目地址:

https://www.aimodels.fyi/models/replicate/903681b6-e6d3-428c-b611-f6afb60b3d18

站长之家提要:

1. JoJoGAN是深度学习模型,将普通面部图像转化为艺术化作品,无需专业干预。

2. 它结合感知损失和身份损失,保持生成图像的个体特征。

3. 需要Nvidia T4GPU,仅适用于面部图像,对GPU性能要求高。

SyncDreamer:从单视图图像生成多视图一致图像以实现3D重建

SyncDreamer是一个端到端的框架,可以从单个视角的图像生成多视图一致的图像,以实现3D重建。

image.png

项目地址:https://github.com/liuyuan-pal/SyncDreamer

站长之家提要:

1. SyncDreamer包含一个diffusion模型和一个differentiable renderer,可以生成质量高、多视图一致的图像。

2. 先通过diffusion模型生成图像,再通过renderer生成对应的多视图,计算一致性损失进行优化。

3. SyncDreamer生成的图像可用于高质量3D重建,有助于推动3D生成技术的进步。

韩国AI研究机构出品!MagiCapture:个性化生成高分辨率肖像照片

韩国AI研究机构推出MagiCapture技术,实现高分辨率肖像照片的多概念个性化生成。该方法采用多概念定制,融合主题和风格概念,只需少量参考即可生成高分辨率肖像照片。

image.png

论文网址:https://arxiv.org/abs/2309.06895

站长之家提要:

1、MagiCapture采用多概念定制方法,融合主题和风格概念,生成高质量个性化肖像照。

2、研究人员提供新的注意力重新聚焦损失和即时学习策略,明显优于基线方法。

3、MagiCapture代表肖像生成领域的重要技术进步,为用户提供更便捷的个性化肖像生成。

📰🤖📢AI新鲜事

B站UP主手作AI男士婚纱引围观 视频播放量超43万

一句话概括:B站UP主受AI男士婚纱照启发,策划一个月成功制作了一套男士婚纱,视频展示了设计过程,播放量超过43万。

image.png

站长之家提要:

1. UP主在女士婚纱基础上改造,加入了露腰设计,使用蕾丝和网纱呼应上衣,创新以网纱替代裙摆。

2. 男士婚纱在现实不常见,需要大胆创新,难度较高,UP主克服了种种困难成功制作。

3. 视频在B站上引发热议,播放量超过43万,许多网友纷纷分享喜好。

小红书博主用AI生成电商模特图赚到2000

小红书博主“知影Studio”使用AI技术为客户生成电商模特形象照,仅用一个下午的时间就完成了6-7套照片创作,质量较高,为电商领域开辟了新的应用场景。

image.png

站长之家提要:

1、博主用AI工具为客户快速生成电商形象照片,只用一个下午完成6-7套照片。

2、AI生成的电商模特图像效率高、质量较好,难以找出破绽。

3、小红书用户希望看到更丰富、更实用的AI生成电商内容,有利于电商领域创新。

Nvidia第二季度交付900吨AI芯片 Meta可能是最大单客户

Nvidia在第二季度交付了900吨AI芯片,其中大部分可能供应给Meta,引发了市场的广泛关注。Omdia的研究表明,对Nvidia AI芯片的需求激增,导致服务器平均价格上涨30%,并且市场规模预测将增长8%。

英伟达,人工智能,芯片,AI,NVIDIA GH200 Grace Hopper

站长之家提要:

1. Nvidia第二季度向客户交付了900吨H100AI芯片。

2. 根据Omdia报告,Nvidia AI芯片需求激增,服务器平均价格上涨30%。

3. 尽管AI硬件需求增加,但AI实际采用增长相对较慢,未来领域特定AI模型将成为重点。

MSN删除了抄袭、乱编的AI文章,但问题仍未解决

MSN刊登了一篇似乎由人工智能生成的文章,涉及前NBA球员Brandon Hunter的死讯,后来被撤下。这篇文章被指责抄袭TMZ Sports博客,并且内容混乱不堪,由一家名为Race Track的出版社制作。尽管MSN删除了这篇文章,但Race Track仍然发布一连串难以理解的文章,MSN继续转载。这问题尚未得到解决。

AI机器人玩游戏

图源备注:图片由AI生成,图片授权服务商Midjourney

站长之家提要:

1. MSN新闻发布了一篇似乎由人工智能生成的文章,内容涉及前NBA球员Brandon Hunter的消息,后来被指责抄袭并撤下。

2. 这篇文章由名为Race Track的出版社制作,内容混乱不堪,很可能抄袭了TMZ Sports博客的内容。

3. 虽然MSN删除了有争议的文章,但Race Track继续发布难以理解的文章,而MSN则继续转载,凸显了内容审查方法的缺失问题。

ChatGPT竞争对手Writer,获得1亿美元融资

Writer获得1亿美元B轮融资,主要面向企业市场,提供类似于ChatGPT的功能,注重数据安全和可解释性。

图片

站长之家提要:

Writer的融资由ICONIQ Growth领投,已吸引知名企业投资,收入增长迅速。

Writer的核心技术是Palmyra大语言模型,已在不同领域取得成功。

Writer提供多种功能,包括文本生成和数据安全,适用于各种主流业务场景。

腾讯AI新专利可判断文件对应情绪

腾讯近日获得了一项关于利用AI处理文本情感的专利。该专利提出了一种方法,可以根据用户查看文档时的情绪反馈,来判断并展示文档的情绪倾向,从而让用户对文档内容有更明确的预判。

微信截图_20230919151936.png

站长之家提要:

1. 专利可以获取用户查看文档时的情绪数据,并展示文档的情绪可视化图像。

2. 根据用户情绪数据实时更新并展示情绪可视化图像。

3. 通过情绪可视化图像,用户可以判断文档内容的情绪倾向,提升体验。

英国公布AI监管原则 开发者须对输出内容负责

英国竞争与市场管理局提出新的AI监管标准,强调开发者对AI输出内容负责,关注问责和透明度,英国政府致力于推动健康发展的AI技术。

站长之家提要:

1、英国竞争与市场管理局引领AI监管,要求开发者负责AI系统输出内容,关注问责和透明度。

2、英国政府计划成为全球AI产业和监管的领导者,将举办全球AI峰会,同时放宽AI文本和数据的版权限制,吸引AI企业入驻。

3、全球范围内,AI监管成为热议话题,各国在制定AI法规和原则方面积极行动,旨在平衡创新和消费者权益。

英伟达与 Anyscale 合作

英伟达与Anyscale合作,旨在提高大型语言模型和生成式AI应用的开发效率,解决处理器需求增加和资源受限的问题。

NVIDIA-Anyscale-logos-x1280.jpg

图片来自NVIDIA

站长之家提要:

1. 大型语言模型在生成式AI工具中需要更多处理器,但处理器价格高昂且供应有限,云资源也无法完全解决扩展规模的问题。

2. 英伟达将其AI技术引入Anyscale平台,支持流行的开源模型嵌入到应用程序中,并提供自动扩展推理功能,提高性能。

3. Anyscale的Ray框架是全球增长最快的可扩展计算统一框架,与英伟达的合作旨在加速大型语言模型和生成AI应用的开发,提供前所未有的速度和效率。

甲骨文发布语音AI助手,助力医疗保健领域

甲骨文公司发布语音生成式AI助手,旨在改善医疗保健领域的工作流程,将整合到电子健康记录解决方案中,提供多模态支持,自动化管理医疗记录,帮助医护人员提高患者护理质量。

AI 医疗 (2)

图源备注:图片由AI生成,图片授权服务商Midjourney

站长之家提要:

1. 甲骨文推出生成式AI助手,解决医疗保健领域的工作效率和人员短缺问题。

2. 助手通过文本或语音命令工作,提供多模态支持,改善电子健康记录的管理和患者护理流程。

3. 助手还提供患者自助服务体验,可用于安排约会或支付账单,预计在未来12个月内全面推出以改善医护工作流程。

人工智能可以检测痴呆症了!有望改善治疗效果

最近宾夕法尼亚州盖辛格健康系统的研究发现,人工智能工具在检测未确诊痴呆症方面具有潜在有效性,提供了改善早期诊断和治疗的新希望。这项研究表明AI在早期痴呆症识别中准确性显著,可为提高生活质量和治疗效果提供支持。

核磁共振 医疗 (2)

图源备注:图片由AI生成,图片授权服务商Midjourney

站长之家提要:

1. 宾夕法尼亚州盖辛格健康系统的研究发现,AI算法在早期痴呆症的诊断中表现出卓越准确性。

2. 早期痴呆症的诊断对干预和治疗至关重要,传统方法通常耗时且困难。

3. AI诊断工具有望提高痴呆症患者的生活质量,加速诊断速度和准确性在临床实践中的应用。

🤖📈💻💡大模型动态

OpenAI多模态AI系统GPT-Vision即将推出 与谷歌Gemini竞争

OpenAI即将推出GPT-Vision多模态AI系统,与谷歌Gemini形成直接竞争。GPT-Vision可支持图像和文本输入,实现视觉能力增强。OpenAI加速商业化布局,意在抢占先机。业内认为OpenAI与谷歌竞争将推动行业技术进步。

gpt-4,OpenAI,ChatGPT Plus,人工智能

站长之家提要:

1、OpenAI将推出GPT-Vision多模态AI系统,与谷歌Gemini直接竞争

2、GPT-Vision支持图像和文本输入,实现视觉能力增强

3、OpenAI与谷歌竞争有利于行业技术进步

多模态大模型MMICL霸榜 支持文本图像视频输入

北京交通大学等机构推出多模态大模型MMICL,它支持文本、图像、视频三种模态混合输入,在多项评测中表现抢眼,已开源两个版本,有望成为多模态领域新宠。

image.png

项目地址:https://github.com/HaozheZhao/MIC

站长之家提要:

1. MMICL支持文本、图像、视频三种模态混合输入,在多项多模态能力评测中表现突出。

2. MMICL采用两阶段训练,可实现“现学现卖”,有效缓解视觉语言模型中的语言偏见。

3. MMICL已开源可商用的Flan版和仅科研用的Vicuna版,都发布在GitHub上。

🤖📱💼AI应用

字节跳动旗下云服务火山引擎数智平台VeDI发布AI助手

字节跳动旗下云服务火山引擎在数据驱动科技峰会上推出了数智平台VeDI的AI助手,通过接入大语言模型,可以帮助企业提升数据处理和查询分析效率,即使不懂编程的员工也可以进行业务运营数据的分析。

站长之家提要:

1. 火山引擎推出VeDI数智平台的AI助手

2. AI助手接入大语言模型,提升数据处理效率

3. 即使不会编程也可以进行业务数据分析

谷歌AI聊天机器人 Bard 新增Gmail等谷歌应用插件

谷歌AI聊天机器人Bard最近更新,新增对Gmail、Docs、Drive等谷歌应用的插件支持,可以实时获取谷歌服务信息并与用户交互。

微信截图_20230919160304.png

站长之家提要:

1. Bard支持应用插件,可以获取谷歌服务实时数据,如地图、YouTube等。

2. 用户可以点击插件图标或输入前缀@调用插件与Bard交互。

3. Bard新增公共链接分享功能,用户可以分享对话给他人在自己设备上继续交互。

Chat Video:用GPT分析和总结视频

ChatVideo是基于人工智能的视频分析和管理工具,利用其独特的AI技术,能够通过语音识别快速转录视频内容成文字,自动生成视频大纲和总结,并提供强大的问答功能,同时还具备多种可视化功能,提高了视频的可用性,使用户能够高效学习和管理视频。

站长之家提要:

1. ChatVideo利用AI技术实现高效视频管理,包括语音识别、自动生成大纲和总结、强大问答功能等。

2. 用户能够通过文字稿件快速定位视频内容,无需重复播放,提高学习效率。

3. 多种可视化功能提升视频理解,用户可选择不同模式获得最佳体验。

举报

  • 相关推荐
  • 大家在看

今日大家都在搜的词: