首页 > 业界 > 关键词  > 浦医2.0最新资讯  > 正文

AI视野:GPT-4 API曝出重大漏洞;阿里巴巴推AI画图框架SCEdit;上海AI实验室浦医2.0发布

2023-12-27 16:11 · 稿源:站长之家

🤖📈💻💡大模型动态

上海AI实验室升级发布“浦医2.0

上海人工智能实验室与上海交通大学医学院附属瑞金医院等在“2023健康中国思南峰会”上发布了医疗多模态基础模型群“浦医2.0”,为跨领域、跨疾病、跨模态的AI医疗应用提供全面支持。

微信截图_20231227085116.png

开源链接:https://github.com/OpenMEDLab

【AiBase提要】

🚀 多领域模型增强:浦医2.0新增多领域模型和语言参数增量,覆盖医学图像、医学文本、生物信息等多个数据模态。

📊 开源数据集丰富:新增规模最大的医学图像分割数据集SA-Med2D-20M和病理数据集SNOW,提供更全面的医学数据支持。

🔗 一站式开源支持:浦医2.0实现了医疗大模型群的一站式开源,通过评测模块提供医疗模型能力参考,推动人工智能在医疗领域广泛应用。

清华大学开发出新视觉语言模型CogAgent

清华大学智普AI团队推出了名为CogAgent的视觉语言模型,专注于理解和导航图形用户界面(GUI)。该模型采用独特的双编码器系统,通过高分辨率跨模块处理复杂GUI元素,在PC和Android平台GUI导航方面优于现有方法。

QQ截图20231227153006.jpg

地址:https://github.com/THUDM/CogVLM

【AiBase提要:】

🧠 双编码器系统: CogAgent采用低分辨率和高分辨率图像编码器,提高对GUI元素的处理能力。

🖥️ 高分辨率跨模块: 独特的架构允许模型有效处理高分辨率输入,优于现有GUI导航方法。

🤖 潜在应用广泛: CogAgent有望在自动化GUI操作、提供帮助和新GUI设计方面产生重大影响。

📰🤖📢AI新鲜事

GPT-4API曝出重大漏洞

近日,FAR AI实验室成功越狱GPT-4API,通过微调、函数调用和搜索增强等方式揭示了重大安全漏洞,使其可能生成错误信息、提取私人信息,甚至插入恶意URL,引发潜在隐私风险。

image.png

论文地址:https://arxiv.org/pdf/2312.14302.pdf

【AiBase提要:】

🚨 GPT-4API存在微调方面的漏洞,通过15个有害样本和100个良性样本的微调,研究人员成功越狱,可能导致生成错误信息、提取私人信息等。

🤖 GPT-4Assistants模型容易暴露函数调用格式,可被诱导执行任意函数调用,同时知识检索容易受到劫持,揭示了API功能扩展可能带来的新漏洞。

🔐 使用者在利用GPT-4时需谨慎,漏洞揭示了即便在灰盒环境下,越狱和隐私泄露的潜在风险,提醒开发者更加关注模型设计和API功能扩展的安全性。

iPhone设计师加入LoveFrom

苹果iPhone设计总监唐坦加入LoveFrom,与OpenAI首席执行官Sam Altman共同开发人工智能硬件,项目被称为“AI版iPhone”,由SoftBank资助。

【AiBase提要:】

🍏 唐坦加入Jony Ive的LoveFrom,与Sam Altman合作开发“AI版iPhone”。

💡 项目由SoftBank资助,涉及外观设计和软件开发。

🏠 LoveFrom讨论的概念包括家庭设备,可能类似于HomePod,但细节未透露。

Anthropic预计年收入将达8.5亿美元

Anthropic PBC宣布计划于2024年底实现8.5亿美元年收入,挑战OpenAI的地位,其由Amazon和Google支持,旗下模型Claude2具备处理复杂提示的能力。

【AiBase提要:】

📈 Anthropic计划2024年底年收入8.5亿美元,较三个月前的预测大幅增长。

🤝 由Amazon和Google支持的Anthropic旗下模型Claude2挑战ChatGPT,处理高达10万令牌的复杂提示。

💰 公司正进行7.5亿美元融资轮,由Menlo Ventures主导,估值预计将达到150亿美元。

谷歌推出Chromebook Plus

谷歌推出Chromebook Plus系列,挑战微软在AI PC领域,宏碁发布商用Chromebook Plus514,搭载AI应用,标志着谷歌在商务领域的发展。

【AiBase提要】

🤖 谷歌推出Chromebook Plus,与微软竞争,展示在AI PC领域的强劲实力。

💼 宏碁发布商用Chromebook Plus514,首次专为商务用户设计,搭载先进的人工智能应用。

💻 谷歌在智能笔记本领域强调人工智能在商务和个人使用中的重要性,积极应对市场需求。

OpenAI预计估值将达1000亿美元

OpenAI正在进行新一轮融资,预计估值将超过1000亿美元,使其成为全球第二大最有价值的初创公司,仅次于SpaceX。

【AiBase提要:】

🚀 OpenAI计划进行新一轮融资,估值或将达到1000亿美元以上。

💡 该公司已在人工智能领域取得显著成就,尤其是通过ChatGPT等产品的成功。

💰 OpenAI还在与G42进行谈判,计划成立一家新的芯片企业,预计融资规模为80亿至100亿美元。

英国大型律师事务所推出撰写合同的AI工具ContractMatrix

英国法律巨头Allen & Overy推出的ContractMatrix是一款AI工具,已有1000多名律师使用,旨在提高律师效率、降低成本,与Microsoft和AI初创公司Harvey合作开发。

【AiBase提要:】

🚀 Allen & Overy推出的ContractMatrix是为律师撰写标准法律合同的AI工具,已有1000多名律师使用。

💼 五家企业客户计划在明年一月试用,与Microsoft和AI初创公司Harvey合作,旨在提高律师效率、降低成本。

💡 ContractMatrix可撰写多种合同文件,包括世界首个由AI生成的合同,Allen & Overy计划将其提供给新客户,并在2024年上半年在Microsoft的企业软件市场上推出。

OPPO Find X7将搭载AndesGPT大模型

OPPO Find X7系列将引入AndesGPT大模型,其中70亿参数的端侧大模型将为小布助手提供更智能、高效的服务。

【AiBase提要】:

🔍 OPPO Find X7系列手机宣布搭载AndesGPT大模型,提供强大的智慧助手服务。

🚀 AndesGPT分为不同体量,首搭70亿参数端侧大模型,提升用户智能化体验。

📈 利用SwappedAttention技术,AndesGPT解决长期记忆带来的推理延迟,显著提升小布助手的响应速度。

足不出户拍冬日写真 抖音AI特效上大分

抖音上的新流行趋势是通过AI特效在雪天拍摄冬日写真,受欢迎的主题包括雪景、圣诞和新年,各种应用如剪映、美图秀秀等提供多种风格模板。

image.png

【AiBase提要】

📸 AI雪景写真热潮:抖音用户足不出户,通过AI特效在雪天拍摄冬日写真,主题包括雪景、圣诞和新年。

🌟 应用广泛:剪映、美图秀秀等应用提供免费AI特效,用户可一键生成多种风格的写真照片。

📈 流行趋势持续:这种AI生成的写真照片成为抖音上的热门趋势,各主题视频播放次数高达数千万次。

小红书博主用AI画出无价的饭获赞21.9万 网友感动哭

近期,小红书博主通过AI创作出感人反转的绘画内容,其中一则描述AI无价的饭成为爆款,获赞超过21.9万,展现了AI在创作领域的新可能性。

图片

小红书@饱饱吖

图片

小红书@饱饱吖

【AiBase提要:】

🎨 AI绘画新玩法: ChatGPT文生图在小红书引爆热潮,用户通过输入“Make it more”触发AI创作,产生许多创意丰富、引人入胜的内容。

🍜 AI感动网友: 以“用5元能吃到什么”为提示词,AI绘制了一碗泡面逐步升级至奶奶做的无价饭,赢得网友赞誉,获赞超过21.9万。

🍫 品牌营销结合AI: 巧克力品牌在小红书发布20条AI绘画相关笔记,成功植入产品,显示品牌营销与AI结合的有效性。

👨‍💻💡🎯聚焦开发者

阿里巴巴推AI画图框架SCEdit

阿里巴巴推出的AI画图框架SCEdit在训练阶段减少52%内存消耗,仅利用ControlNet所需参数的7.9%,实现内存使用量减少30%。

image.png

项目地址:https://scedit.github.io/

【AiBase提要:】

🚀 创新框架: SCEdit通过深入研究U-Net中跳跃连接的作用,提出高效生成式调整框架,显著减少训练参数、内存使用率和计算开销。

🖼️ 图像生成优势: 项目通过注入不同条件与可控SC-Tuner简化网络设计,在文本到图像生成和可控图像合成任务上展现出效率和性能优势。

🌐 开源计划: SCEdit宣布开源,尽管未提供具体代码,但吸引开发者参与实现,推动框架的进一步发展。

上海人工智能实验室最新项目PIA放出演示 可将写实照片转换成3D动漫效果

该项目PIA是上海人工智能实验室最新推出的,通过文本控制图片内容生成视频,实现将写实照片转换成3D动漫效果。用户可定制图像动画,生成速度较快,效果不错,但存在人物小瑕疵。

image.png

【AiBase提要:】

😲 PIA项目由上海人工智能实验室推出,能通过文本生成视频,将写实照片转换成3D动漫效果。

🚀 PIA不仅限于图像动画,还提供个性化定制服务,让用户根据需求定制图像动画效果。

🌐 项目试玩地址为https://top.aibase.com/tool/pia,生成速度快,效果可,但存在人物小瑕疵。

举报

  • 相关推荐
  • 大家在看
  • 有道AI PPT:智能PPT创作工具,一键生成专业演示文稿。

    有道AI PPT是一款基于人工智能技术的演示文稿创作工具,它通过理解用户输入的文本内容或主题,快速生成具有专业设计的PPT幻灯片。该产品利用先进的AI算法,简化了PPT的制作流程,提高了工作效率,尤其适合需要快速制作演示文稿的用户。产品背景信息显示,有道AI PPT由网易有道推出,依托于网易在人工智能领域的深厚技术积累。目前,产品提供有限次数的免费体验,具体价格和定位信息需要登录后查询。

  • DataGemma:连接大型语言模型与谷歌数据共享平台,减少AI幻觉现象。

    DataGemma是世界上首个开放模型,旨在通过谷歌数据共享平台的大量真实世界统计数据,帮助解决AI幻觉问题。这些模型通过两种不同的方法增强了语言模型的事实性和推理能力,从而减少幻觉现象,提升AI的准确性和可靠性。DataGemma模型的推出,是AI技术在提升数据准确性和减少错误信息传播方面的重要进步,对于研究人员、决策者以及普通用户来说,都具有重要的意义。

  • 汉语新解TextHuman:AI生成汉语词汇新颖解释及图像。

    汉语新解是一个基于AI技术的项目,它使用李继刚的Prompt模板对中文名词进行二次翻译,并生成美观的图像。该项目不仅提供了智能词汇解释功能,还支持SVG图像生成,使得每个解释都配有独特的视觉化展示。此外,它还提供了预设模板、图像下载与复制功能,以及响应式设计,以适配不同设备的屏幕,提供流畅的用户体验。

  • Bossjob App:东南亚首个聊天式职业平台,直接与老板对话,快速求职。

    Bossjob是一款面向东南亚市场的聊天式求职平台,它通过直接聊天和技能匹配的方式,为求职者和雇主提供快速、高质量的求职和招聘流程。该平台特别适合那些希望简化求职流程、快速找到工作机会的专业人士,以及希望快速招聘合适人才的雇主。Bossjob的主要优点包括AI驱动的职位匹配、直接与雇主聊天、灵活的工作选择(远程、混合或现场工作)以及快速的招聘流程。

  • seed-vc:零样本声音转换技术,实现音质与音色的高保真转换。

    seed-vc 是一个基于 SEED-TTS 架构的声音转换模型,能够实现零样本的声音转换,即无需特定人的声音样本即可转换声音。该技术在音频质量和音色相似性方面表现出色,具有很高的研究和应用价值。

  • 文字卡片生成器:AI驱动的创意文字卡片生成工具

    文字卡片生成器是一款利用人工智能技术,为用户提供创意文字卡片生成服务的在线工具。用户只需输入一个词语,AI即可在几秒钟内生成一张独特的文字卡片,卡片内容包含对输入词语的幽默或深刻点评。该产品以其快速生成、高质量输出、个性化定制等特点,满足了用户在社交媒体分享、创意表达等方面的需求。

  • Zion:无代码开发平台,快速搭建个性化应用

    Zion是一个无代码开发平台,它通过提供预置的大模型和完善的生态服务体系,使得用户无需编写代码即可构建AI应用、SaaS应用和消费级应用。该平台支持高效的运维方式和多端发布,包括网页、H5、小程序等,同时提供API连接、可视化开发、数据模型管理后台等功能,以满足不同业务场景的需求。Zion的目标是降低AI应用的使用成本和复杂度,提升开发效率,帮助用户快速实现数字化转型。

  • Pagen AI Landing Page Template:由Pagen AI创建的AI着陆页模板

    Pagen AI Landing Page Template是一个由Pagen AI创建的AI着陆页模板,使用Next.js和Shadcn UI构建。它允许用户快速搭建一个专业的着陆页面,用于展示AI相关的产品或服务。该模板易于定制,支持本地开发和预览,适合需要快速上线AI项目展示页面的开发者和企业使用。

  • Vchitect 2.0:由上海人工智能实验室开发的先进视频生成模型

    Vchitect 2.0(筑梦2.0)是一款由上海人工智能实验室开发的高级视频生成模型,旨在赋予视频创作新的动力。它支持20秒视频生成,灵活的宽高比,生成空间时间增强,以及长视频评估。Vchitect 2.0通过其先进的技术,能够将静态图像转换为5-10秒的视频,使用户能够轻松地将照片或设计转换为引人入胜的视觉体验。此外,Vchitect 2.0还支持长视频生成模型的评估,通过VBench平台,提供全面且持续更新的评估排行榜,支持多种长视频模型,如Gen-3、Kling、OpenSora等。

  • reader-lm-1.5b:将HTML内容转换为Markdown的AI模型

    Jreader-lm-1.5b是由Jina AI开发的一款文本生成模型,专门用于将HTML格式的内容转换为Markdown格式。这一技术对于需要进行内容转换的开发者和内容创作者来说非常重要,因为它可以自动完成格式转换,提高工作效率。该模型在Hugging Face平台上提供,支持多语言,并且可以在Google Colab上免费试用。

  • reader-lm-0.5b:将HTML内容转换为Markdown格式的模型

    Jina Reader-LM是一系列将HTML内容转换为Markdown内容的模型,适用于内容转换任务。该模型在精选的HTML及其对应Markdown内容上进行训练,能够高效地处理网页内容的格式转换,为内容创作者和开发者提供便利。

  • Reader-LM:将网页HTML内容转换为清晰的Markdown格式。

    Reader-LM是Jina AI开发的小型语言模型,旨在将网络中的原始、杂乱的HTML内容转换为清洁的Markdown格式。这些模型特别针对长文本处理进行了优化,支持多语言,并能够处理高达256K令牌的上下文长度。Reader-LM模型通过直接从HTML到Markdown的转换,减少了对正则表达式和启发式规则的依赖,提高了转换的准确性和效率。

  • NotebookLM Audio Overview:将文档转化为AI生成的音频讨论,便于学习和记忆。

    NotebookLM是一款帮助用户理解复杂信息的工具,通过摘要和提供相关引用来简化信息的获取。它现在提供了一个名为'Audio Overview'的新功能,用户可以通过一键操作,将文档、幻灯片、图表等转化为AI生成的音频讨论。这些讨论不仅总结了材料内容,还在主题之间建立联系,并且可以下载以便随时随地收听。尽管Audio Overview仍处于实验阶段,存在一些限制,例如生成大型笔记本的音频概述可能需要几分钟时间,并且AI主持人目前只能使用英语进行解释,有时可能会引入不准确的内容,用户还不能打断它们。但这个功能为那些通过听对话来学习和记忆效果更好的人提供了新的学习方式。

  • OpenAI o1:AI推理模型,解决复杂问题的新系列。

    OpenAI o1是一系列新开发的AI模型,旨在通过更长时间的思考来解决科学、编码和数学等领域的复杂问题。这些模型通过训练学习,能够细化思考过程、尝试不同策略并识别错误。在国际数学奥林匹克竞赛的资格赛中,o1模型的得分远高于之前的GPT-4o模型,展现了其在数学和编码方面的优势。此外,o1系列还引入了新的安全训练方法,使其能够更好地遵循安全和对齐准则。

  • Serra:AI驱动的招聘搜索引擎,精准匹配顶尖人才。

    Serra Search是一个AI驱动的招聘搜索引擎,它通过集成到您的ATS(申请跟踪系统)和诸如Github、LinkedIn等来源,帮助您快速找到并根据特定标准和预测的工作表现对候选人进行排名。该产品利用GPT技术,能够根据用户输入的特定要求,如'具有SaaS经验和UX设计技能的产品经理',展示最匹配的候选人。它还提供候选人筛选、技能搜索、推荐候选人匹配度评估、检查虚假申请和提供候选人多样性指标等功能,以帮助实现多元化和包容性目标。

  • Fit.AI:个性化健身计划,与朋友一起锻炼,保持健康生活。

    Fit.AI 是一款提供超个性化健身计划的应用程序,它通过分析用户的健身水平、目标和偏好来定制专属的锻炼方案。这款应用具有与朋友一起锻炼的功能,可以增加锻炼的趣味性和互动性,同时通过4周的周期性计划帮助用户保持动力和跟踪进度。此外,Fit.AI 提供24小时的AI教练服务,提供指导、反馈和激励,就像口袋里的私人教练。简洁的界面设计和每日文章功能,为用户提供了持续的动力和健身知识。Fit.AI 还支持Apple Health集成,自动记录用户的锻炼数据。

  • Genkin:使用聊天系统跟踪现金流,深入分析消费习惯。

    Genkin是一个基于聊天系统的现金流跟踪工具,它利用AI技术为用户提供即时的财务洞察。用户可以通过自然语言与Genkin对话,轻松添加日常交易记录。此外,Genkin还提供清晰的交互式图表,帮助用户理解自己的消费习惯,并通过筛选和排序功能实现全面控制。产品由Indrajit、Omezibe Obioha、Ashish Raikar和Saif Farooqui等全栈开发者和工程师团队开发,旨在为用户提供一种全新的网络工具使用体验。

  • Belstad:实时、非党派新闻应用

    Belstad是一个完全自动化的、个性化的AI驱动新闻应用,用户可以实时阅读可消化的、非党派的事件摘要,并通过多种功能深入了解新闻内容。

  • Command AI:AI驱动的用户辅助平台

    Command AI是一个以人工智能技术为基础,提供非打扰式用户辅助的平台。它通过个性化提示和自助服务选项,帮助产品和增长团队提升用户体验。平台包括AI引导的提示、产品导览、调查问卷、公告、清单、帮助中心和Spotlight等功能,旨在通过先进的AI技术,提供更加个性化和高效的用户支持。

  • Scripe:使用AI快速创建病毒式LinkedIn帖子

    Scripe是一个专注于LinkedIn个人品牌建设的AI工具,它通过将语音、视频和文本输入转换为个性化的社交媒体帖子,简化了策略和内容创作过程。它不仅仅是一个通用的AI内容工具,更像是与了解您品牌内部的经验丰富的营销人员合作。Scripe的主要优点包括快速内容创作、个性化钩子生成器、数据驱动的分析、智能日历安排以及团队协作功能。它使内容创作变得简单快捷,无需写作技巧,帮助用户在LinkedIn上发布病毒式和目标导向的内容。

今日大家都在搜的词:

热文

  • 3 天
  • 7天