标签: AI

  • Naver推出Agent N:统一AI代理引领服务新体验

    Naver CEO介绍Agent N

    Naver宣布推出统一AI代理”Agent N”

    Naver于11月6日在首尔江南举行的年度Team Naver Conference DAN25上,由CEO崔秀妍宣布将于明年初推出统一AI代理”Agent N”,首先从购物AI代理开始。这一AI代理旨在整合Naver的各项服务,为用户提供从信息获取到实际行动执行的无缝体验。

    Agent N的核心功能与特点

    整合多项服务

    Agent N整合了搜索、购物、预订和支付等Naver服务,能够理解用户的行为上下文,将所有Naver服务连接成一个流程。AI会解读情况并提出或执行适当的操作。

    购物AI代理率先推出

    Naver购物AI代理会分析用户的预算、品味、搜索历史和产品评论反应,推荐合适的产品,然后代表用户执行添加到购物车或完成支付等操作。

    从搜索到执行的升级

    崔秀妍表示:”生成式AI将更好地理解用户意图,并将其与内容、产品和服务联系起来,将体验从通过搜索获取信息扩展到执行实际行动。一旦进入统一代理阶段,用户将不再需要考虑输入什么搜索词。”

    未来规划:AI Tab的添加

    为实现这一目标,Naver将于明年上半年在其统一搜索服务中添加”AI Tab”。崔秀妍补充道:”已经有很多AI服务,未来还会有更多,但很少有公司能将搜索、日常体验和执行在一个平台上连接成一个连贯、自然的流程。Naver的方向将成为AI时代用户体验的标准。”

    Agent N for Business

    除了消费者版本,Naver还在为合作伙伴和合作公司开发”Agent N for Business”。商业版将涵盖对合作伙伴增长至关重要的领域——广告、客户关系管理(CRM)和定价策略。它将全面分析行业,诊断情况并提出解决方案,也可以实际执行。

    Naver的技术优势与愿景

    崔秀妍强调:”将Naver的创新理念转化为现实的驱动力是我们作为全栈AI公司的本质,我们自主设计和运营从数据中心、云基础设施到服务的每个技术层。我们已经确保了可扩展的高性能GPU基础设施和数据中心容量来支持所有这些。”

    她总结道:”韩国的AI现在正从基础设施迅速扩展到服务,从服务扩展到整个行业,就像宽带时代一样。当Naver独特的AI驱动软件创新与韩国在半导体、汽车、造船和国防等制造业优势相结合时,韩国的工业AI转型才真正开始。”

    信息来源:朝鲜日报

  • 免费申请使用百度千帆AI模型API

    免费申请使用百度千帆AI模型API

    AI模型的api是真的广泛应用了,你现在使用的很多软件都是链接到这些大模型的api,然后利用ai模型发反馈给你提供服务,其中赚取插件。

    今天我们可以浅尝一下AI模型api,而且是免费的。

    这里先所一些应用场景,

    比如你会发现一些博客文章里有AI摘要,

    比如你使用沉浸式翻译插件里的翻译服务,

    再比如一些虚拟陪聊…

     

    进入主题

    点击链接进入

    按规则创建应用

    你会发现应该配置里你无法选择,不过创建后可以去禁用那些你不用的、收费的。

    在“模型推理”——“预制服务”中将不需要的关闭,以避免被莫名调用产生费用。

    创建完应用你会在“应用接入”中看到你的应用ID和API Key,有了它,你就可以填写到需要调用ai的应用中了。

    我应用在了“沉浸式翻译”中,效果比微软、腾讯好。

    结束

  • 欧盟《人工智能法》简介及原文下载

    欧盟的《人工智能法案》(AI Act)是在2024年5月21日由欧盟理事会正式批准通过的。该法案于2024年8月1日正式生效。这是全球首部全面监管人工智能的法规,旨在规范人工智能系统的开发、部署和使用。

    该法案的生效标志着欧盟在规范人工智能应用方面迈出了重要一步。它包含了一系列旨在确保人工智能技术安全、可靠并保护用户权利和自由的规则和措施。法案中规定的某些规则将在法律通过后6个月或12个月开始生效,而大部分规则预计将于2026年8月2日开始实施。

    以下简介

    欧盟的《人工智能法案》(AI Act)是一项旨在规范人工智能系统在欧洲市场使用的立法提案。该法案的主要目的是确保人工智能技术的发展和应用既安全又可靠,同时保护用户的权利和自由。以下是该法案的主要内容:

    1. 适用范围:法案适用于所有在欧盟市场上投放的人工智能系统,无论是本地开发的还是从第三国进口的。
    2. 风险等级分类:法案将人工智能系统分为四个风险等级(从低到高),不同等级的系统将面临不同的监管要求。
      • 低风险:例如,简单的数据分析工具。
      • 有限风险:可能对个人或公司造成一定影响的系统。
      • 高风险:可能对个人安全或基本权利造成严重影响的系统,如自动驾驶汽车。
      • 不可接受的风险:违反基本权利或法律原则的系统,如用于社会评分或操纵人类行为的系统。
    3. 禁止和限制:法案明确禁止使用某些类型的人工智能,如用于操纵人类行为的AI和实时面部识别系统在公共场所的大规模监控,除非在特定情况下获得批准。
    4. 透明度和可解释性:法案要求所有人工智能系统都必须具备透明度,使得用户和监管机构能够理解AI的决策过程。
    5. 数据治理:法案强调了对训练数据的质量和代表性的要求,禁止使用歧视性数据。
    6. 技术措施和合规性:法案要求高风险AI系统必须具备特定的技术措施和安全标准,并要求进行事前合规评估。
    7. 监督和执行:法案建立了监督机制,包括国家监管机构和欧盟层面的协调。
    8. 责任和救济:法案明确了AI系统的责任归属,包括制造商、开发商和用户的责任,并提供了相应的救济途径。
    9. 国际合作:法案鼓励与其他国家和国际组织在人工智能领域的合作。

    《人工智能法案》的目标是促进创新,同时确保人工智能技术的使用不会损害公民的权利和自由。这是欧盟在人工智能领域的一个重要步骤,旨在为人工智能技术的开发和应用制定全球标准。

     

    同济大学与上海市人工智能社会治理协同创新中心  关于该法案的翻译与研究发布地址

    https://aisg.tongji.edu.cn/info/1005/1222.htm

    中译文下载地址

     

    英文原文

    来自https://www.aiact-info.eu/full-text-and-pdf-download/

     

    欧盟官网关于人工智能法案的一些搜索

    https://commission.europa.eu/index_en?wt-search=yes

     

    这里搜索到一个有关于欧盟人工智能法案的发展与分析的网站,有一些资讯

    Home

  • 金数据AI考试系统,出题-答题-评分-统计

    金数据AI考试系统地址:[icon-url href=”https://b.2109.love/749″ target=”_blank”]网址[/icon-url]

    个人觉是一个很方便的出题考试系统,很简单,出题的优劣根据自己的情况见仁见智了。

    你可以上传自己的材料,也可以直接输入你想要出题的内容,系统会给出自己的理解题目

    生产的题目你可以根据自己的需要进行增删,这个很自由。

    完成后就可以直接发布了,这样分享链接,就可以直接在线作答。

    答题很直接,完成后系统会判定结果,直接出分数,这样你可以很直观看到你答对和答错的。

    系统会记录有多少人答题,答题分数多少等数据。

     

    可以试试,值得试试。

  • 快手可灵大模型——AI视频生产

    快手可灵大模型——AI视频生产

    https://kling.kuaishou.com/
    近日,快手“可灵”视频生成大模型在人工智能领域引起广泛关注。该模型由快手 AI 团队自研,采用了与 Sora 相似的技术路线,并结合多项自研技术创新,效果对标 Sora。

     

    可灵大模型具备众多显著优势。它能够生成大幅度的合理运动,通过 3D 时空联合注意力机制,更好地建模视频中的复杂时空运动,使生成的运动更符合客观规律;可以模拟真实物理世界的特性,无论是光影反射、重力影响下的流体运动,还是与物理世界的交互,都能生成符合物理规律的视频;具备强大的概念组合能力和想象力,能够将用户丰富的想象力转化为具体的画面,例如让熊猫弹吉他唱歌等创意场景轻松实现。

     

    在视频生成方面,可灵大模型表现出色,其生成的视频分辨率高达 1080p,时长可达 2 分钟(帧率 30fps),还支持自由调整宽高比。目前,该模型已在快影 App 开放邀测体验,用户反馈热烈,申请内测人数众多。

     

    6 月 21 日,可灵大模型发布重磅更新,正式开放图生视频功能,支持将静态图像转化为 5 秒钟视频,且用户可通过提示词文本控制图像中物体的运动。同时推出的视频续写功能,支持对生成视频一键续写和连续多次续写,最长可生成约 3 分钟视频。

     

    快手可灵大模型的出现,不仅在国际大模型技术圈层展现了中国技术的领先可能,也加速了 AI 生成视频产品的竞争。它的成功研发,为创作者和行业从业者提供了强大的技术支持,有助于提升创作效率和质量。

     

    在未来的发展中,快手将继续推动可灵大模型的完善和应用场景的拓展。据悉,在 7 月举行的 2024 世界人工智能大会(WAIC)上,快手还将发布最新的大模型技术与应用战略,包括快手大模型技术矩阵全景、基座模型技术创新、应用和落地情况等,有望为用户带来更加丰富多彩的视频内容体验,进一步推动人工智能技术与短视频行业的深度融合与发展。

     

    可灵大模型的诞生,是快手在 AI 技术领域深入探索和创新的重要成果,也体现了中国人工智能在视频生成模型方面的实力和进步,为中国人工智能的发展路径提供了新的方向和启示。
  • 【AI前沿科技快报】

    1. Moshi大模型震撼发布,多模态能力挑战GPT-4O

    开源界迎来重磅消息,Kyutai实验室推出的Moshi大模型,以其卓越的多模态能力,成为GPT-4O的有力竞争者。Moshi不仅能够理解人类的语音提问并实时作出回应,其语音模式的开放速度更是领先于GPT-4O。这款模型具备听、说能力,未来或将展现视觉理解,其快速响应与人性化对话风格赢得了用户好评。Moshi的教育应用潜力巨大,有望为学生提供个性化学习辅导。Kyutai实验室计划不久后开源Moshi,共享代码、模型权重和论文,推动AI技术的普及与发展。

    2. Google Pixel 9:AI赋能,摄影新革命

    谷歌即将推出的Pixel 9系列智能手机,将搭载一系列AI创新功能,彻底改变摄影体验。Add Me功能能智能融合不同照片中的人物表情,确保每一张合照都尽善尽美;Studio功能则集成到截图编辑器中,让用户轻松创作和混搭贴纸,释放无限创意;Pixel Screenshots功能则着重于隐私保护,仅在手动截图时激活,确保用户信息安全。这些新功能彰显了谷歌在AI领域的深厚技术积累和创新实力。

    3. Perplexity AI Pro Search升级,智能搜索再进化

    Perplexity AI宣布其Pro Search服务完成重大升级,新版本不仅增强了复杂查询处理能力,还引入了多步推理功能,显著提升了问题解决和代码执行能力。通过整合Wolfram|Alpha引擎,Pro Search在数学和编程问题上的解答更加准确高效,为科研人员和工程师提供了强有力的辅助工具。

    4. Cloudflare创新防御,抵御AI爬虫威胁

    面对日益猖獗的AI爬虫,网络安全巨头Cloudflare推出了一键式防护方案,有效阻止AI机器人抓取网站内容,保护内容创作者免受侵权困扰。通过先进的机器学习模型,Cloudflare能够精准识别并拦截伪装的网络爬虫,为互联网安全环境筑起坚固防线。

    5. ElevenLabs VOICE ISOLATOR:音频制作的革命

    ElevenLabs最新发布的VOICE ISOLATOR,是一款革命性的音频处理工具,它能有效消除背景噪音,清晰提取人声,极大提升音频作品的专业水准。该工具的Extract vocals功能,使得音频后期制作更加高效便捷,为音频创作者提供了前所未有的创意空间。

    6. 商汤科技Vimi:视频生成技术新里程碑

    商汤科技近期推出的Vimi模型,在视频生成领域树立了新标杆。Vimi模型具备出色的可控性,能够精准操控人物表情与肢体动作,生成高质量的视频内容。其稳定输出长达1分钟的高清视频,保持了画面的一致性与连贯性,展现了商汤科技在视频生成技术上的深厚底蕴。

    7. MimicMotion:AI技术革新舞蹈与动作捕捉

    MimicMotion技术的发布,标志着AI在舞蹈视频生成与动作捕捉领域的重大突破。该技术采用置信度感知姿势引导,生成高质量的人体运动视频,同时通过手部精炼机制强化细节表现,能够灵活生成任意长度的视频,为视频制作与动作捕捉行业带来了无限可能。

    8. ChatGPT Mac客户端安全漏洞警示

    OpenAI的ChatGPT Mac客户端被发现存在安全漏洞,对话记录以明文形式存储,可能暴露于恶意攻击之下。OpenAI已迅速响应,发布更新加密对话记录,加强用户数据安全防护。这一事件再次提醒科技公司在软件开发过程中,需重视数据安全与隐私保护。

    以上信息来源权威渠道,展示了AI技术在各个领域的最新进展与应用,为科技爱好者与从业者提供了宝贵的洞察。敬请关注我们的持续报道,掌握AI世界的脉搏。


    注:上述新闻依据相关公告与报道整理而成,旨在提供AI科技领域的最新动态。

  • MoneyPrinterTurbo,一个标题生成短视频(影像、字幕、语音)

    MoneyPrinterTurbo,一个标题生成短视频(影像、字幕、语音)

    打赏码💴在文末,感谢您的支持!!!🤩

    给文章点个赞(赞多出视频),让他向前排,给更多人看到。

    如果大家有在线使用需求,可以留言,我会考虑在服务器上部署

    MoneyPrinterTurbo是MoneyPrinter的中文版,原本MoneyPrinter不支持中文,由Harry做了本地化处理。两个开源程序都是收货了很多的star。

    界面其实很简单,也是很容易操作的。

     

    先给出原作者的软件开源地址

    github: https://github.com/FujiwaraChoki/MoneyPrinter

    中文版本:https://github.com/harry0703/MoneyPrinterTurbo

    github有时访问不是很顺畅,所以我放在了下面的网盘里

    [wxshow][c-downbtn type=”123″ url=”https://www.123pan.com/s/WVmtjv-vu6rh.html” pwd=”yy8q”]MoneyPrinterTurbo中文版[/c-downbtn][/wxshow]

    设置不难,但是有点费劲

    设置语言很简单不说了。

    下面设置需要几个api

    1、数据大模型

    这些可以选择,但很多不容易申请,选择大陆的比较容易点

    Moonshot(kimi的公司)是我目前首选。

    https://platform.moonshot.cn/console/api-keys

    {Qwen是通义千问(阿里的)、Gemini谷歌的,Azure微软的,Ollama百度的,另外的应该是转接口。}

    直接点击进入,获取API

    获取后粘贴到设置中。

    2、图片及视频网站pexels api_key

    他是一个国外网站,所以访问起来会很…慢。他需要你注册,提供电话、和一个不一定真实的地址。然后需要邮箱验证。

    别的没什么了,就是…慢。

    参数/生成

    然后 你就可以设置一些参数,开始你的视频生成

    这里说明一下音频设置-朗读声音,你需要选择CN的语音模型,选择其他的容易报错。

    报错Ta会提示

    | ERROR | "./app\services\task.py:80": start - failed to generate audio, maybe the network is not available. if you are in China, please use a VPN.

     

    当然生成过程中还是有可能有其他问题,其中一个原因是获取图片视频网站的素材比较费劲,只是国内网络的问题,不是你的问题。有问题那你可以去群里咨询谈论。

    https://github.com/harry0703/MoneyPrinterTurbo 底部有个“交流讨论”二维码

    总体来说不算复杂,但是也别对生成的视频报太大期望。如果你把ta当做生产力工具,你需要自己完善文本,选择更适合你语言环境的视频及图片网站,更加精准及多元的关键字,更加符合视频主题的音频工具。

    最后

    我的建议,类似功能剪影有,而且各种元素可以编辑,可操作性比较好。

    看看剪映的功能

    [图文成片]

    他生成的视频可编辑是最大的优点,这样就很灵活,对于你不满意的修改就好了。

    分析原理:

    需要大模型出文案,然后系统根据文案内容抽取关键字,翻译成英文,到图片视频网站检索相关内容,进行组合,然后根据文字生成语音,成片。

    资源

    软件有各种系统版本,个人认为ta没有强大到我去费劲部署到其他不常用的系统上。Windows上试试就可以了。

    Windows

    下载后,建议先双击执行 update.bat 更新到最新代码,然后双击 start.bat 启动Web界面

     

  • 国产sora,其实叫vidu,由生数科技和清华大学联合开发

    看看官方的视频

    其实你稍仔细一点是能看出不尽如人意的地方的。sora也是一样。

    视频大模型横空出世源于sora,今天(2024年4月27日)国产的vidu发布了。新闻非常多,已经冲上热搜,那么闲杂的不说了,浅显的总结一下。

    1、采用原创的Diffusion与Transformer融合的架构U-ViT。(不懂,感觉很高端)

    2、支持一键生成长达 16 秒、分辨率高达 1080P 的高清视频内容。

    (如果你能做到视频风格、形象的统一,完全可以做连续的故事性视频内容,这很重要)

    3、理解中国元素,这一点原视频体现了两地,一个是熊猫、一个是龙。个人认为中国意义的龙和西方理解的确实不同。

    4、非单一镜头,长镜头、追焦、转场衔接。

    物理效果、光影效果、形象逻辑、画面连贯一致性,这些最基础的了。

  • 《终结者 2》翻拍版《Our T2 Remake》——全球首部AI 生成的长篇电影

    《终结者 2》翻拍版首映
    3 月 6 日,全球首部完全由 AI 生成的长篇电影《终结者 2》翻拍版《Our T2 Remake》在洛杉矶举行首映。“主演”之一 Timmy the Terminator 在社交平台晒出自己的“首映礼红毯照”。这部电影由 50 位 AI 领域艺术家联合创作,展示了人类对抗人工智能统治的世界,探讨了当代 AI 发展的影响。
    该团队使用多个 AIGC 工具创作,不使用原电影任何镜头、对话或音乐,确保所有内容均为原创。这将是 AI 在电影制作应用中的重要里程碑,团队希望向世界展示 AI 赋予每个人创作史诗级故事的能力。

    目前,该电影尚未大规模放映,本周末将在线上直播。虽然线下首映式门票已售罄,上座率也不低,但社交平台上暂未有影评发布。

     

    生成式人工智能对影视产业的影响
    如今,人工智能可以模拟生成大量不同的角色和场景,提升影视创作效率。普通用户也能借助人工智能的力量,将想象以更好的可视化方式呈现。生成式人工智能降低了影视创作门槛,提高了质量下限,推动了“社会视频化”进程。Sora 的出现降低了视频媒介的进入门槛,提升了其通用性和可达性,也打破了元宇宙发展的核心桎梏。

    影视创作者的应对策略
    影视创作与生成式人工智能的结合,为创作带来了新活力。创作者应了解、利用、训练和警惕这项技术。充分发挥其积极作用,将其融入创作过程,同时保持警惕,防止创作同质化,避免失去对作品的掌控力。此外,还要注意版权和伦理问题,确保影视产业健康发展。
  • 有什么行业将改变!OpenAI Sora模型问世,文本直接变视频


    先来看看这些官方demo视频,看看他们可以达到什么程度

    2月16日

    openai再次扔出一枚深水炸弹

    发布了首个视频生成模型sora

    消息一出

    相关话题立刻登上热搜

    据介绍,sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。

    目前官网上已经更新了48个视频demo,在这些demo中,sora不仅能准确呈现细节,还能理解物体在物理世界中的存在,并生成具有丰富情感的角色。

    (更多…)