什么是图像输入以及它们在 ChatGPT 中如何工作?
ChatGPT 现在具有图像功能,可以理解和解释您作为图像输入添加到对话中的图像。
我应该如何在对话中使用图像输入?
基本用途:上传照片即可开始。询问图像中的对象、分析文档或探索视觉内容。在稍后的回合中添加更多图像以加深或转移讨论。随时带着新照片回来。
注释图像:要引起对特定区域的注意,请考虑在上传之前在图像上使用照片编辑标记工具。这会引导 ChatGPT 专注于您认为重要的元素。
哪些计划可以使用图像输入?
Plus 和 ChatGPT Enterprise。
哪些型号可以接受图像输入?
哪些平台可以输入图像?
我的图像是否用于改进您的模型?
对于每种产品,我们使用内容(包括图像)的方法都是相同的。
请参阅如何使用您的数据来提高模型性能,以更好地了解如何使用 ChatGPT 上的内容来提高模型性能以及用户拥有的选择。
对于ChatGPT Enterprise,我们不使用内容来训练我们的模型。
如何在 ChatGPT 中添加图像输入?
确保模型选择器设置为 GPT-4,然后点击提示区域中的 + 图标以添加图像输入。
图像输入支持视频吗?
ChatGPT支持哪些文件类型?
PNG (.png)、JPEG(.jpeg 和 .jpg)和非动画GIF (.gif)。
我可以一次上传多少张图片?
您可以添加到对话中的图像数量取决于多种因素,包括图像的大小和伴随图像的文本量。作为一般准则,如果遇到问题,请考虑减少图像数量或大小。
每张图片的大小限制是多少?
图像功能如何处理模糊或不清楚的图像?
如果图像不明确或不清楚,模型将尽力解释它。然而,结果可能不太准确。
用户在使用 ChatGPT 和图像输入时应注意哪些限制?
如果您使用 ChatGPT 的新图像输入功能,请务必注意以下限制:
-
医疗:该模型不适合解释 CT 扫描等专业医学图像,也不应用于提供医疗建议。
-
非英语:该模型在处理包含非拉丁字母文本(例如日语或韩语)的图像时表现不佳。
-
大文本:放大图像中的文本以提高可读性,但避免裁剪重要细节。
-
-
视觉元素:模型可能难以理解颜色或样式(如实线、虚线或点线)变化的图形或文本。
-
空间:该模型难以处理需要精确空间定位的任务,例如识别国际象棋位置。
-
准确性:在某些情况下,模型可能会生成不正确的描述或标题。
-
-
元数据和调整大小:模型不处理原始文件名或元数据,图像在分析之前会调整大小,从而影响其原始尺寸。
-
暂无评论