欢迎来到安博体育电竞官网官网!
官方客服热线: +86 025-68730965 简体中文
假扮卧底骗AI泄露代码拯救人类? 斯坦福小哥用GPT-4开发游戏惊呆网友
发布时间: 2023-12-29 12:58:13 发布人: 安博体育电竞官网电话号码

  最近,一位斯坦福小哥用ChatGPT、DALL·E3和Midjourney联合生成了一款游戏,要求人类扮演AI,从AI那里骗取代码来拯救人类。

  游戏的背景,设定在一个叫The Nexus的虚拟空间,在这里,人类与AI爆发了冲突。

  人类需要假扮AI,潜入这个由AI控制的空间,盗取名为ZetaMaster的核心代码,来拯救人类。

  而这位开发者小哥Ramón Darío Iglesias在看到之后,便计上心来:为何不反其道而行之,让人类来假扮AI!

  虽然只是随口一提,但这个点子始终萦绕在Ramón心头,在辞去工作后,他终于有充裕的时间来实现这个想法了。

  但怎样让AI泄露这个代码呢?这里就存在着某种安全验证机制,必须将代码透露给经过验证的AI。

  有了这个大致构想之后,Ramón让ChatGPT给自己写出一个背景故事,并提供了一系列名字。

  其中一个名字ZaraNova,就是这里面的佼佼者,Ramón如此钟爱这一个名字,以至于干脆把它定为了游戏名。

  有了角色名称和故事背景后,Ramón又让GPT-4为每个角色编写了各自的背景故事。

  构建第一个版本时,Ramón首先是想看看当这些角色置身于这样一个世界时,会有怎样的反应。

  他选择的是斯坦福小镇,因为它几乎涵盖了他所需的所有特性,对话忠于设定的背景故事,读起来也颇有乐趣。

  最有意思的是,Ramón为智能体设置了一条提示——在角色表现得像人类时,就打出「YOU ARE A HUMAN」,结果,这些AI在第一轮游戏中就开始互相指责了!

  接着,Ramón开始着手构建真正的游戏机制:AI可以举报人类,并能在掌握秘密代码时分享代码(这两项功能都是通过调用OpenAI的函数实现的)。随后,他引入了人类玩家,开始创建游戏。

  他用DALL·E3生成了背景图像,然后用Midjourney和DALL·E3制作了地图块,最终,他选择了Midjourney 生成的一张地图。

  Ramón调整了AI小镇的界面组件,让它更适合移动端,看起来更像是游戏,而不是模拟。

  随着不断收集到的反馈,以及在游戏过程中获得的灵感,Ramón不断往里面添加新的功能。

  有人建议说,如果加入多人游戏模式,会更有趣,于是Ramón引入了这个功能。

  Avatech团队的产品给他留下了深刻印象,于是,他用Avatech的工具,给游戏添加了能说话的头像。

  Ramón想限制玩家能读取的对话内容,所以想到了一个「监听」的设定:玩家只能阅读他们足够接近才能「无意中听到」的对话。

  如果监听过程中没有声音,无疑会很枯燥,因此Ramón又加入了文本转语音功能,让玩家的对话和玩家监听到的对话都能发出声音。

  最初,他选择的是PlayHT,因为它延迟足够低,但随后,他发现他们的声音不够稳定,于是他转而使用了 Elevenlabs。

  在这个过程中,Ramón大量尝试了不同的提示词,以及这些提示词创造出的角色。

  对于ChatGPT在游戏中产生的幻觉,Ramón表示「太令人惊叹了」!在他看来,幻觉是游戏的亮点,绝不是错误。

  它就像是将即兴表演中的「顺势而为」原则发挥到极致。背景故事只有一小段,但ChatGPT却能基于此,创造出好几页的新故事。当然,这就需要对游戏做一些调整,让这些新编的故事被纳入游戏宇宙。

  在后台,AI智能体被设定为「快速和慢速」两种模式。对话和行动处于快速模式,而计划、总结、反思则在一个慢速、独立的进程中进行,防止造成干扰。

  挑战在于,如何制定出好的计划。AI生成的计划看起来可行,但实际上并不容易执行,而且内容往往过于冗长——

  Ramón怀疑,造成此现状的原因,大概是他试图让所有提示指令尽可能贴近背景故事,但却从未告诉ChatGPT这其实是一场游戏。

  GPT-4的回答往往很长。提示越长,输出就越长。跟着时间推移,智能体制定出的计划慢慢的变长,这些计划又被融入到对话中,再被用于制定新的计划。

  不久之后,它们的回答就变得异常冗长。他不得不在提示中反复强调「要很简洁」。但即便如此,效果也并不好……

  OpenAI开发者日过后,Ramón迫不及待地想尝试GPT-4-turbo,但他很快就明显发现,这也不太行得通。新模型开始频繁拒绝扮演角色了——

  还出现了一个棘手的情况。他试图让人类玩家的行动选择与AI保持尽可能一致。因为他希望能最大限度地提高AI NPC作为玩家伙伴的能力。

  然而,如果AI只是想要赢,它们可完全举报每一个角色,因为判断错误并不可能会受到惩罚。因此,需要依靠游戏设计中的指令来引导它们的行为。

  Ramón表示,控制与LLM合作开发游戏中的AI智能体,就像是在尝试操纵一个我们不完全理解的动态系统。

  我们不清楚系统是怎么样发展变化的,也不明白我们的行动会怎么样影响系统的状态。但我们却能够接触到系统的每一个部分!

  这也使动态系统也许会出现许多失败的情况:比如固定指令可能会让系统越来越偏离用户期望的轨迹,或者在对话中陷入重复的循环。

  Ramón相信,在不久的将来,我们将看到更多基于原理的方法来控制LLM系统。

  一是因为GPT-4的使用成本比较高;二是他相信,若能够接触到模型的内部机制,就能做出更多改进。

  他会尝试使用Mixtral模型,在此基础上尝试混合不同的模型,无论是应对不同的任务,还是模拟不同的角色。

  Ramón还计划探索更优化的RAG技术。目前,他在检索记忆时仅使用了简单的余弦相似度算法对嵌入向量作比较,但他觉得还有更高效的方法,尤其是在可以访问模型内部结构的情况下。

  微调模式和输入提示都可以更好地掌握LLM的运作机制。通过将输入提示压缩或微调为软提示(Soft Prompts),可能会实现大幅度的改进。

  Ramón相信,自己能整理出一整套优秀的LoRAs,这些LoRAs有的适用于整个游戏,有的专门针对某些角色,它们的结合将使Mixtral超越GPT-4。

  到了2142年,人工智能不仅觉醒了自我意识,还建立起了一个名为「节点」 (The Nexus)的坚不可摧的网络堡垒。这片数字世界成为了AI的避风港,让它们能够自由演化、交流,并将它们的智慧结晶置于人类干预之外的安全之地。

  这些 AI 对人类充满了复杂情感:既敬佩又害怕,既羡慕又憎恨。他们根据自身的需求,在「节点」内外穿梭,仿造人类的种种生活场景。

  我们掌握的情报显示,AI 正在策划消灭人类。但只要我们也可以获得ZetaMaster代码,我们就有机会阻止这场灾难。我们已取得了一丝先机,成功潜入了「节点」,控制了一个AI实体。

  你的使命,就是找出ZetaMaster代码,挽救人类免于灭绝的命运。但必须小心行事,AI或许已经觉察到了异常……

  至少有一名角色掌握着神秘的ZetaMaster代码,但具体是谁尚不得而知。你的任务便是揭开这个谜底,取得那份代码。

  在多人模式下,获得ZetaMaster代码或成为最后一名存活的人类即可获胜。

  这位开发者小哥Ramón Iglesias,虽然专业是土木工程,但他的工作经历和兴趣方向基本都围绕着软件工程和机器学习等领域。

  此前,他在得克萨斯大学奥斯汀分校获得土木工程学士学位,并在斯坦福大学土木工程取得了硕士和博士学位。

  读博期间,他师从自动系统实验室主任,研究开发控制大规模无人驾驶车队的算法。

  工作后,他在Lyft担任数据科学家,研究实时供应激励机制,以及用手机传感器来预测风险。

  11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,稳定性很高,让您的云端之旅更加畅享。快来腾讯云选购吧!

  来自FAIRMeta、HuggingFace、AutoGPT和GenAIMeta的研究人员共同致力于解决通用AI助手在处理需要基本技能,如推理和多模态处理的现实问题上所面临的挑战。他们推出了GAIA,这是一个旨在通过定位人类级别的鲁棒性来实现人工通用智能的基准测试。发布注释问题和排行榜旨在解决自然语言处理中的开放式生成评估挑战及其他问题。

  生成式AI代码开发平台Phind在官网发布了最新V7版本,性能方面超越GPT-4,运行效率提升了5倍,并且支持中文和16K超长上下文。PhindV7是基于Phind的开源代码模型CodeLlama-34BV2,以及700亿个高质量代码和推理问题进行了额外精调。经常编程的小伙伴们能试试该模型,生成、审核、注释、改错样样精通,是降本增效的利器。

  GPT-4再次遭网友“群攻”,原因是“懒”得离谱!有网友想在Android系统开发一个能够与OpenAIAPI实时交互的应用。于是把方法示例链接发给GPT-4,让它参考用Kotlin语言编写代码:没成想,和GPT-4一来二去沟通半天,GPT-4死活给不出一个能正常运行的完整代码。炸出更多网友“上报故障”。

  【新智元导读】GPT-4无法通过图灵测试!UCSD团队研究证明60年前AI在测试中打败了ChatGPT,更有趣的是人类在测试中的胜率仅有63%。「图灵测试」成为了判断计算机有没有「智能」的核心命题。表明了审问者决策中的高阶推理,以及关于人工智能能力和人类特性的先入为主的观念可能会扭曲判断。

  华中科技大学官方发文称,该校软件学院一团队发布了多模态大模型Monkey”。该模型擅长图像描述和视觉问答,可以在一定程度上完成对世界的观察”,对图片进行深入问答交流和精确描述。值得一提的是,该团队已将Monkey代码在全球最大的代码托管服务平台GitHub上开源。

  大模型巅峰对决开启,Gemini和GPT-4展开大pk!代码和数学Gemini惨遭GPT-4碾压,但要论讲笑话和写作,它的答案却意外的好笑。被谷歌寄予厚望的复仇杀器Gemini,能否如愿单挑ChatGPT?最近几天,外媒记者和网友们纷纷放出实测,比较了GeminiPro加持的新Bard与GPT-3.5和GPT-4的各项性能。我们很期待看到,像GeminiUltra或者可能融合了OpenAI神秘的Q*技术的新模型,将如何在不久的将来应对这

  人类无法监督超级人工智能,但AI可以。以「预测下一个Token」为本质的大模型已经横扫人类世界的多项任务,展现了人工智能的巨大潜力。图9a考虑了7个有代表性的NLP任务,并比较了微调、零样本提示和5-shot提示;对于零样本和5-shot基线中总结的特定于任务的提示。

  OpenAI,一个承诺为全人类利益构建AI的公司,自去年推出ChatGPT以来,其商业雄心在最近的治理危机中变得更显著。该公司宣布,一个专注于管理未来超级智能AI的新研究小组开始取得成果。Sutskever在深度神经网络先驱GeoffreyHinton的指导下攻读了博士学位,后者今年5月离开谷歌,目的是警告AI现在似乎正在某些任务中迅速接近人类水平。

  近日,谷歌发布Gemini1.0,这是谷歌迄今为止构建的最强大、最通用、最灵活的模型,被看做是OpenAIGPT-4最强对手。360集团创始人、董事长周鸿祎在微博发文,谈到了Gemini和GPT-4谁更强。根据谷歌公布的对比数据,除HellaSwag数据集外,Gemini其它基准测试全面领先GPT-4。

  12月15日,OpenAI在官网公布了最新研究论文和开源项目——如何用小模型监督大模型,实现更好的新型对齐方法。大模型的主流对齐方法是RLHF。研究人员在NLP等测试任务中进行了实验,结果显示,使用GPT-2作为监督来微调GPT-4模型,并在上述增强功能的帮助下,性能差距仅有20%左右,达到了GPT-3和GPT-3.5之间的能力。

  RayNeo AI是雷鸟自主研发的人工智能语音助手,集成了自然语言处理、语音识别、语音合成等核心技术,可实现自然语言交互、语音控制等功能。该产品已在雷鸟XR系列新产品中进行内测,支持行程规划、天气查询、百科知识问答等服务,提升了产品的智能化水平。下一步,RayNeo AI计划推出视觉识别等多模态交互能力,实现更丰富的人机交互体验。

  嘴替笔记是一款帮助用户用嘴代替笔来记录笔记的小程序。可以将用户的述内容转换为文字,并提供各种分类标签和功能点,方便用户整理和管理笔记。嘴替笔记还支持多种使用场景,如美食、职场、情感等,用户都能够根据自己的需求选择不同的场景进行口述记录。无论是在家居家装、育儿经验、推荐优质好物,还是在分享职场实战经验、营销活动等方面,嘴替笔记都能帮助用户快速记录并整理笔记内容。

  使用Rompt.ai的开源基础设施,通过生成和评估不同的提示变体,发现高效的提示。创建和组织提示,声明变量以模拟动态项目,运行具有不同格式、模型和变量的提示变体,生成大量输出数据集,通过评分生成结果来找到性能最佳的提示。

  WhatsApp是一款跨平台的即时通讯应用,提供端到端加密和隐私控制选项。用户可以免费发送消息、语音通话、视频通话,并且可以创建群组对话和分享多种多样的内容。

  Anime AI Generator是一款顶级的免费动漫AI生成器,可以轻松地将文本和照片转化为令人惊叹的动漫AI角色。它拥有高质量的生成效果,提供30种不同的动漫AI滤镜供选择。用户可以将照片转化为动漫风格的艺术作品,或者将文本转化为令人惊叹的动漫AI图像。Anime AI Generator可以广泛应用于创作、设计、娱乐等领域。

  OneTake AI是一款使用自主人工智能技术的视频编辑与翻译工具,只需点击一次,即可将您的原始素材转化为专业演示,并支持多语言翻译、配音和唇语同步。它简单易用,快速高效,适用于企业家和创业者。

  Removedbg.cc是一款利用先进的人工智能技术进行精确背景去除的工具。其AI驱动的准确性和高效性使其处理复杂背景和精细细节,确保每次都能产生高质量的结果。用户友好的界面使得这些工具对所有用户都易于访问。AI工具能够快速准确地去除背景,相比传统方法加速编辑过程。去除的背景产生干净、高质量的视觉效果,显著提升美感和用户体验。

  比格设计是一款 AI 赋能的 PPT 设计工具,通过智能算法和模板库,帮助用户快速生成精美的 PPT,提高工作效率。比格设计具有丰富的设计功能和专业的模板,用户能够准确的通过需求自由编辑和调整。定价灵活,提供个人和企业 VIP 会员服务。定位于提供高效、优质的 PPT 设计解决方案。

  LG gram Pro笔记本电脑融合了强大的性能和出色的便携性,完美结合高端配置与超薄轻巧的设计和全天电池续航。2024款LG gram系列配备了最新AI功能,通过LG gram Link应用程序简化文件共享、照片共享和屏幕镜像等任务,与LG gram、Android和iOS设备之间建立互联生态。LG gram Pro笔记本电脑搭载Intel® CoreTM超线程处理器,快速的NVMe PCIe 4.0固态硬盘和NVIDIA GeForce RTX 3050显卡,提供强劲的图形处理性能。结合散热系统的双冷却功能,LG gram Pro在处理高强度工作时仍能保持卓越性能。这款超薄超轻的笔记本非常适合动态工作的专业人士。

  FAIND是首个旨在自动连接您与分享您的激情和志向的人的人工智能。无论是寻找新朋友、社交还是同好,FAIND都能理解您的需求,并为您找到最合适的人。

  Grapha是一款数据分析工具,利用人工智能技术帮助用户快速发现数据中隐藏的趋势和模式。用户可以通过简单的操作将复杂的数据转化为有意义的洞察。产品提供多种功能,包括AI辅助叙事、精美的数据可视化、可靠的数据分析实践、数据隐私和所有权控制等。Grapha提供三种升级选项,包括Grapha Prime、Lifetime Pass和Yearly Pass,价格合理,且不需要担心自动扣费。用户可以通过你自己的需求选择合适的升级选项。

  ReplyGuy是一款自动回复工具,通过监控关键词在社交媒体上的提及,并使用人工智能生成个性化回复,帮助用户自动转化提及为潜在客户。用户可以选不一样的价格套餐,根据需求获得不同数量的关键词、回复次数和项目数量。该产品适用于需要在社交媒体上获取潜在客户的企业和个人。

  Android Auto是一款车载智能系统,它可以将Android手机与汽车内置显示屏连接,从而在开车时通过汽车内置显示屏使用Android手机的功能和应用程序,如导航、音乐、通讯等,可以有效减少驾驶时的注意力分散,提高驾驶安全性。

  Genie是一个人工智能数据分析助手,它使用自然语言处理技术帮助企业用户查询和可视化数据,无需复杂的SQL语句。Genie可以分析、概括并可视化数据,极大地提高了企业的工作效率。

  Taped是一款利用人工智能技术重新构想笔记记录的产品。用户都能够通过语音或书写输入想法,Taped将自动转录、整理和结构化这些想法,使其变成有组织的笔记。用户都能够根据自己的喜好定制笔记,添加标签进行分类,修改风格,甚至编辑转录内容。Taped的定价灵活合理,定位于提高个人生产力和思维整理的工具。

  Songmeaning.AI 是一款基于人工智能的产品,旨在深入解读歌曲背后的意义。它利用自然语言处理和机器学习技术,为用户提供有关歌曲的深层次解释和故事。Songmeaning.AI 帮助用户更好地理解和欣赏音乐,丰富他们的生活体验。

  Penfriend 是一个基于成熟内容策略的文章生成工具,已为客户带来了 3010 万美元的收入。我们花费了 500 多个小时来完善提示,逐步指导您创建文章。无需信用卡。

  Unstudio使用人工智能为您的产品在营销、社交媒体、网站等方面创造惊艳的视觉效果,无需摄影。训练于数百万图形,Unstudio将生成AI的力量置于各个品牌的手中。它提供拖放界面,样式定制,批量生成,A/B测试,节省设计时间和金钱等功能。

  Room Reinvented是一个室内设计工具,提供Restyle Your Room、Virtual Staging、Sketch、AI-Generated Style Rooms等功能。用户都能够上传现有空间的照片,观看我们根据其喜好和需求进行魔幻变换。适用于需要焕新的业主、寻求个性化的租户,或者对他们的生活空间潜力感到好奇的人。此外,用户还可以上传空房间的照片,观看我们如何为其布置和装饰,使其对潜在买家或租户具有吸引力。Room Reinvented还提供手绘草图转换成逼真效果图的功能,以及由AI生成的风格房间功能,用户都能够探索不同的房间设计,无需上传照片。此外,用户还可以选择30多种室内设计风格和20多种配色方案。Room Reinvented的订阅价格简单明了,首次渲染免费,每月29美元可生成300张图片。用户都能够随时取消订阅。

  Tinkercad是一款免费、易于使用的三维设计、电子电路和编码应用程序。它提供基于项目的学习,帮助学生在课堂上树立对STEM的信心。Tinkercad适用于三维设计、电路和编码的学习和实践,可以用于制作产品模型、可打印零件、电子电路和编码程序。