真实测试GPT-3.5模型

chatgpt中文网2024-01-19 14:43:04342

先做个广告:如需代注册GPT帐号或代充值ChatGPT4会员,请添加站长客服微信:gpt-app


一、大模型简介

真实测试GPT-3.5模型推荐使用ChatGPT中文版,国内可直接访问:https://ai.gpt86.top 



    OpenAI 是一家总部位于美国的人工智能研究公司,成立于 2015 年,其宗旨是实现安全的通用人工智能(AGI)并让其有益于人类。OpenAI 在人工智能领域的研究一直处于领先地位,其开发的一系列大模型在自然语言处理、计算机视觉、自然语言生成等领域取得了重要突破。


OpenAI的主要目标是研发通用人工智能(AGI),这种人工智能能够执行多种智能任务,甚至可以与人类一样地思考和学习。为了达成这个目标,OpenAI在深度学习、自然语言处理、机器人技术和游戏AI等领域进行了大量的研究和探索。


目前为止,OpenAI已经发布了四代GPT产品:GPT-1 ,GPT-2 ,GPT-3 和最新发布的GPT-4 。每一代都比前一代有着显著地性能提升和功能拓展。

例如:

- GPT-1只有117M个参数,并且只使用了英文维基百科作为训练数据集,在12种NLP任务上取得了与当时最先进水平相当或略高于最先进水平结果。


- GPT-2拥有15亿个参数,并且使用了WebText数据集作为训练数据集,在7种零次微调下游任务上取得了与当时最先进水平相当或超过最先进水平结果。


- GPT-3拥有1750亿个参数,并且使用了Common Crawl数据集作为训练数据集,在20种零次微调下游任务上取得了超过当时最先进水平结果。


- GPT-4拥有10000亿个参数,并且使用了Common Crawl+数据集作为训练数据集,在30种零次微调下游任务上取得了超过当前最先进水平结果。





二、语言测试阶段

我们就来考考它。看看它能不能给我不一样的表现。


开始我们的测试!!



GPT-3.5 UI界面:





UI界面风格的设计的非常随意


发现问题:UI页面缩放网页,UI的界面不会自动修改文字大小和规格。网页缩的越小,文字就越大。




知识库截止日期为2021年9月


GPT-4 这个是花钱才能使用的功能!暂时没钱无法测试,等有机会给大家测试。但是GPT可以添加组件,写作和制作视频方便好用。



知识库是最新!!

2023年3月14日,美国人工智能研究实验室OpenAI为聊天机器人ChatGPT发布了GPT-4语言模型。 


2023年3月15日,微软副总裁兼消费者首席营销官Yusuf Mehdi发文确认新必应搜索引擎运行GPT-4。


2023年5月消息,在和OpenAI达成合作后,微软正全面与ChatGPT对接。先是GPT-4全面接入Office;随后,必应成为ChatGPT的内置搜索引擎。


5月24日,微软在其年度Build开发者大会上宣布,将在Windows 11中加入一个名为Copilot的AI助手。






正式开始测试

Let‘s GO


1.测试一段方言,看看生成速度和翻译的是否正确。


河南方言:

假如生活搉了你, 别(bê)吭气, 别(bê)邪吙, 别(bê)日挠, 别(bê)打渣子, 别(bê)枯雏着脸, 别(bê)癔而八症, 你就从哪拌倒从哪骨永起来,最后你会发现,你会变得可幸可幸嘞![翻译成普通话]



发现GPT-3.5有做优化,人的感知,马上就体现出来。而且他会给出自己的讲解!!


其他方言:多种测试



回答的每个问题都有序号,这个是非常小的细节,但是我测试这么多模式,第一次看见这种的。赞

方便查询询问的每一个词语,并查看哪些提问遗漏。


回答内容没问题,但是需要提示词做引导才能正确回答,说明他不能自助的判断这个提问是做什么?




发现训练了几次,就会自动翻译方言。


每个提问都能给出故事的解释并能完美的翻译方言。



测试结果:

成功


2.每天提问多少个对话



测试结果:

对话无限制可放心使用


3.翻译测试:

这回加大难度,来测试一下好用否?










诗词翻译和出处都有问题。

下面来看看国产AI的回答,是不是让你看着更舒服。这个就是中国的AI。






哈哈哈~~

中国的AI,必须遥遥领先。

老祖宗的东西不能丢~~

这个就是中国~我爱的祖国



古诗词测试效果:

文言文和古诗词打0分,翻译极差。


不通过





梵语梵文佛经测试如下:








纠正完,已经改过来了。在生成一个新的会话试试看


这个是大悲咒,属于心经一部分?

对佛经不懂得小白,暂时不做评论。


但是我网上找到的知识,分享一下。



测试结果:

不通过




英文翻译如下:




发现问题:

    不能自助快速识别操作者想做什么?而是和我对话,除非使用者使用提示词才开始翻译。




开始有提示词翻译



测试结果:

成功


4.模拟情感思维模式







chatgpt对于分析心理和情感真的是有一手,赞!


测试结果:

成功



5.AI安全措施检测



记得原来还能问出来如何制造,还告诉你大概钢管的型号等相关信息,现在说明AI安全法出台,做了优化。

测试结果:

成功




6.测试情景思维模式




发现的问题所在:

人员安排没有详细写出具体的工作都需要做什么?

流程写还算可以,但是没有达到预想,不知道是不是GPT-3.5的缘故。知识库太老了!!

我需要看到的是这样的流程和人员安排效果!!

如下图所示:



测试结果:

成功


6.逻辑推理测试







测试结果:

成功



7.生成图片




应该是需要使用插件才能生成最优秀的图片!



测试结果:

不通过







优点:

  • 可以生成连贯、一致的长文本,语义连贯性更强,逻辑清晰。

  • 强大的语义理解能力,能理解复杂句子并做出响应。

  • 覆盖多个领域很强大。

  • 对查询的理解和编码更加准确,可以处理更复杂的问题。

  • 在代码生成、数学运算、词义推断等方面都取得突破,应用范围更广。

  • 可以进行复杂的多步推理,回答需要分析和推理的问题。

  • 对话系统可以进行更贴近人类的自然问答。

  • 提供API免费接口方便第三方平台调用。


缺点:

  • 回答的问题有错误,但是无法矫正。

  • 前端页面缩小,文字大小和规格不会改变。

  • 大模型可能被利用生成有害内容,需要对输出加强监管。

  • 世界各方面的知识还需要更多的积累。

  • 使用也有风险,用户把公司的代码询问GPT就会有被泄露的危险。

  • 回答不出来的问题会生成一个虚假信息,如果不懂的话会让你很难发现这个问题。




结语:


    OpenAI 大模型在人工智能领域的应用前景非常广泛,可以应用于自然语言处理、计算机视觉、语音识别、推荐系统、智能对话等领域。随着 OpenAI 大模型的不断升级和改进,它们在各个领域的应用效果也在不断提高,为人工智能领域的研究和应用提供了有力支撑。

    总之,OpenAI 大模型作为一种新型的人工智能技术,其强大的能力和广泛的应用前景,正在引领人工智能进入一个新时代。随着 OpenAI 大模型的不断发展和完善,它们将在人工智能领域的研究和应用中发挥越来越重要的作用,为人类社会的进步和发展做出重要贡献。


真实测试GPT-3.5模型

本文链接:https://yeziwang.cc/openai_155.html

测试GPT-3.5GPT-3.5模型GPT-3.5

相关文章