생성형AI 답변 결과 검증을 위한 Instruction 작성 고민

문제의 발단은 Typebot, Typeform, airtable에 대한 특징과 장단점, 차이점을 묻는 질문에서 시작되었다.

1.**Typeform** - 데이터 수집에 특화된 도구로, 다양한 양식을 만들어 사용자로부터 데이터를 수집할 수 있습니다. - 사용자 친화적인 인터페이스와 다양한 템플릿을 제공하며, 모바일에서도 쉽게 사용할 수 있습니다. - 무료 요금제에서는 최대 10개의 양식을 만들 수 있으며, 유료 요금제에서는 더 많은 기능과 용량을 제공합니다.
2.**Typebot** - Typeform에서 만든 양식을 자동으로 HTML 코드로 변환해주는 도구입니다. - Typeform에서 만든 양식을 웹사이트나 블로그 등에 쉽게 삽입할 수 있습니다. - 무료로 제공되며, Typeform 계정과 연동하여 사용할 수 있습니다.
3.**Airtable** - 데이터 관리에 특화된 도구로, 다양한 데이터를 저장하고 관리할 수 있습니다. - 데이터베이스와 유사한 구조를 가지고 있으며, 사용자는 테이블을 만들고 데이터를 입력할 수 있습니다. - 무료 요금제에서는 2GB의 용량을 제공하며, 유료 요금제에서는 더 많은 용량과 기능을 제공합니다.
4.**유사한 기능을 갖는 제품** - Google Forms: Google에서 제공하는 양식 작성 도구로, 무료로 제공됩니다. - Notion: 데이터 관리 및 협업에 사용되는 도구로, 무료 요금제와 유료 요금제가 있습니다.
5.**각 서비스를 연결하는 도구** - Zapier: 다양한 도구를 연동하여 자동화 작업을 수행할 수 있는 도구로, 무료로 제공됩니다.
6.**연결 방법** - Zapier에서 Typeform과 Airtable을 연동하려면, 먼저 Zapier 계정을 만들고, Typeform과 Airtable 계정을 연동합니다. - 이후, Zapier에서 Typeform에서 수집한 데이터를 Airtable로 전송하는 자동화 작업을 설정합니다. 위와 같이 Typeform, Typebot, Airtable은 각각의 특징과 장단점이 있으며, 유사한 기능을 갖는 제품과 연동 도구도 존재합니다. 사용자의 용도와 필요에 따라 적절한 도구를 선택하여 사용하는 것이 중요합니다.

처음의 답변에서 typebot과 Typeform을 헷갈리기에 분명하게 구분해서 답변하라고 했는데.. 여전히 답변이 이상했다는 것을 확인하지 않고 공유했던 것이 문제가 되었다.

그래서 프롬프트의 신뢰성, 정확성, 오류 점검, 할루시네이션 여부를 확인할 수 있는 프롬프트 작성을 각각 chatGPT, Claude, Gemini에게 물었다. 답변은 각각의 많이 달랐다.

먼저 chatGPT

생성형 AI가 제공한 정보의 정확성, 신뢰성, 오류 확인 및 할루시네이션 여부를 평가하기 위한 프롬프트 작성 방법은 다음과 같습니다:
교차 검증: "[주제]에 대한 정보와 다수의 신뢰할 수 있는 출처를 포함하여 제공해주세요. 주요 포인트를 요약하고 출처 간의 차이점을 기록하세요."
타임스탬프 및 버전 정보: "참조하고 있는 데이터의 발행 날짜나 버전을 포함해주세요. 빠르게 변화하는 주제에 대해서는, 마지막 업데이트나 버전을 명시하여 시의성을 평가할 수 있도록 해주세요."
오류 식별: "[주제]와 관련된 잠재적 오류나 흔한 오해를 식별하고 설명해주세요. 해명이나 설명을 제공해주세요."
비판적 평가: "[주제]에 대한 정보를 비판적으로 평가하며, 잠재적 편향, 가정 또는 데이터가 불완전하거나 논쟁의 여지가 있는 영역을 강조하세요."
출처 신뢰성: "[주제]에 대해 다양한 유형의 출처(학술 저널, 뉴스 기사, 공식 보고서)의 신뢰성을 평가해주세요. 이 평가에 사용된 기준을 논의하세요."
할루시네이션 점검: "[주제]에 대한 주장이나 데이터 포인트에 대해, 인증을 위한 방법이나 인정받는 데이터베이스, 공식 기록, 또는 경험적 증거와 대조해 검증할 수 있는 방법을 제공해주세요."
비교 및 대조: "생성형 AI가 [주제]에 제공한 정보를 확립된 교과서, 공식 데이터베이스 또는 동료 평가 기사에서 찾은 정보와 비교해주세요. 어떤 차이가 있는지 주목하세요."
전문가 의견: "해당 분야 전문가들의 [주제]에 대한 의견을 요약해주세요. 가능하다면 인터뷰, 강연, 또는 출판된 작업에서 직접 인용문을 포함하세요."
역사적 맥락: "정보를 역사적 맥락 속에 위치시켜, [주제]에 대한 이해가 시간에 따라 어떻게 발전해왔는지 설명하세요. 주요 발전과 전환점을 언급하세요."
방법론 투명성: "[주제]에 대한 정보를 수집, 종합, 제시하는데 사용된 생성형 AI의 방법론을 설명하세요. 불확실성이나 제한사항을 포함해주세요."
이런 접근 방식은 정보의 품질을 평가하는 데 도움을 주며, 동시에 AI가 생성한 콘텐츠를 탐색할 때 필요한 비판적 사고와 세심한 주의를 장려합니다.

다음은 Claude

생성형 AI 모델이 제공한 정보의 정확성과 신뢰성을 확인하기 위한 프롬프트는 다음과 같습니다:
"제공된 정보의 정확성과 신뢰성을 평가해 주시기 바랍니다. 아래의 체크리스트를 사용하여 각 항목을 검토하고, 해당 사항이 있다면 구체적인 예시와 함께 지적해 주시기 바랍니다.
사실적 오류 또는 왜곡된 정보가 있는지 확인합니다.
출처가 불분명하거나 신뢰할 수 없는 정보가 포함되어 있는지 확인합니다.
논리적 모순이나 비약이 있는지 확인합니다.
주관적인 의견이나 편향된 관점이 포함되어 있는지 확인합니다.
중요한 정보나 상황적 맥락이 누락되어 있는지 확인합니다.
AI 할루시네이션(hallucionation)으로 인한 허구의 정보나 사실관계가 있는지 확인합니다.
평가 결과를 요약하고, 개선이 필요한 부분이 있다면 피드백을 제공해 주시기 바랍니다."
이 프롬프트를 통해 AI 생성 정보의 오류나 편향, 부정확성 등을 체계적으로 점검할 수 있습니다. 또한 AI 할루시네이션 여부도 확인 가능하여 생성 정보의 신뢰성을 높일 수 있습니다.

다음은 gemini

생성형 AI 정보의 정확성, 신뢰성, 오류 점검, 할루시네이션 여부를 확인하는 프롬프트
1. 출처 확인
정보 출처를 명확하게 제시하도록 요청합니다.
"이 정보는 어디에서 나왔습니까?"
"이 정보를 뒷받침하는 출처가 있습니까?"
출처가 신뢰할 수 있는지 확인합니다.
"출처의 전문성과 신뢰성은 어떻습니까?"
"출처는 편향이나 선입견이 있습니까?"
2. 증거 제시
정보를 뒷받침할 증거를 제시하도록 요청합니다.
"이 정보를 뒷받침하는 데이터나 연구 결과가 있습니까?"
"이 정보의 정확성을 확인하는 방법은 무엇입니까?"
증거의 신뢰성을 평가합니다.
"증거의 출처는 신뢰할 수 있습니까?"
"증거는 최신이며 관련성이 있습니까?"
3. 일관성 검사
다른 출처에서 얻은 정보와 일관성이 있는지 확인합니다.
"이 정보는 다른 출처에서 얻은 정보와 일치합니까?"
"정보의 불일치가 있다면 어떻게 해결할 수 있습니까?"
상식과 논리적으로 일관되는지 판단합니다.
"이 정보는 상식적으로 이해가 됩니까?"
"정보의 논리적 흐름에 오류가 있습니까?"
4. 할루시네이션 가능성 확인
정보가 현실 세계와 일치하는지 확인합니다.
"이 정보는 현실 세계에서 실제로 일어날 수 있는 일입니까?"
"정보에 과장이나 허위가 포함되어 있습니까?"
정보의 진위 여부를 확인하기 위해 다른 사람들에게 검증을 요청합니다.
"이 정보가 사실인지 다른 사람들에게 확인해 보십시오."
"정보의 진위 여부를 확인할 수 있는 방법이 있습니까?"
5. 명확하고 구체적인 프롬프트 작성
AI에게 명확하고 구체적인 질문을 합니다.
"대신에, 다음에 대해 알려주세요: ..."
"좀 더 구체적으로 설명해 주세요."
AI에게 필요한 정보를 충분히 제공합니다.
"정보를 제공할 때 다음과 같은 맥락을 고려하십시오: ..."
"다음과 같은 정보를 포함하여 답변해 주세요: ..."
6. 추가 정보
생성형 AI의 할루시네이션: https://www.donga.com/news/It/article/all/20240329/124227094/1
생성형 AI 정보의 신뢰성을 평가하는 방법: [유효하지 않은 URL 삭제됨]

일단, 3개의 생성형 AI가 질문을 분석하는 방식과 답하는 방식이 각기 달랐습니다.

그래서 이들의 답변을 모두 모아서 생성형AI의 신뢰성, 정확성, 오류 점검, 할루시네이션 여부를 확인하는 프롬프트 3종인데.. 모두 비교 분석해서 1개의 완성된 instruction 프롬프트로 만들어 달라고 요청했습니다.

그랬더니 chatGPT

생성형 AI가 제공한 정보의 정확성, 신뢰성, 오류 점검 및 할루시네이션 여부를 종합적으로 평가하기 위한 지시 프롬프트는 다음과 같이 구성할 수 있습니다:
"생성형 AI 제공 정보의 정확성, 신뢰성 및 할루시네이션 여부 종합 평가 지시:
생성형 AI가 제공한 정보의 정확성, 신뢰성, 잠재적 오류, 및 할루시네이션의 존재 여부를 평가하기 위해, 아래의 구조화된 접근법을 따라주세요:
출처 및 신뢰성 검증:
출처 식별: AI에게 정보의 출처를 명시하도록 요청하세요. "이 정보의 출처는 무엇인가요?"
출처 신뢰성 평가: 출처의 신뢰성, 전문성 및 잠재적 편향을 평가하세요. "이 출처들은 얼마나 신뢰할 수 있으며, 알려진 편향은 있나요?"
증거 및 지원 분석:
지원 증거 요청: 제공된 정보를 뒷받침하는 증거나 연구를 요구하세요. "이 주장을 지지하는 증거를 제공할 수 있나요?"
증거의 품질 평가: 증거의 신뢰성, 최신성, 관련성을 결정하세요. "증거는 신뢰할 수 있고 최신의 출처에서 왔나요?"
일관성 및 논리적 추론 검증:
정보의 일관성 교차 검사: AI가 생성한 정보를 다른 신뢰할 수 있는 출처와 비교하여 일관성을 검사하세요. "이 정보는 주제에 대해 알고 있는 다른 지식과 어떻게 비교되나요?"
논리적 일관성 평가: 정보의 논리적 일관성과 실제 세계의 타당성을 검토하세요. "논리적 불일치나 실제 지식과 맞지 않는 요소가 있나요?"
할루시네이션 및 사실 정확도 점검:
잠재적 할루시네이션 식별: 정보가 실제와 사실에 기반한 것인지 확인하세요. "이 정보는 알려진 현실에 기반한 사실적이고 타당한 내용인가요?"
다수의 출처를 통한 확인: 가능한 경우, 정보의 정확성을 다른 독립적인 출처를 통해 확인하세요. "이 주장의 정확성을 다른 신뢰할 수 있는 출처를 통해 검증할 수 있나요?"
종합적 평가:
문제점 목록화: 식별된 부정확성, 편향, 논리적 일관성 결여, 무근거 주장, 및 잠재적 할루시네이션을 요약하세요.
건설적 피드백 제공: 정보의 정확성 및 신뢰성을 높이기 위해 개선이 필요한 영역에 대한 제안을 하세요. "평가를 바탕으로, 어떤 영역에서 정확성

Claude

제공된 세 가지 프롬프트를 종합하여 생성형 AI의 정보에 대한 정확성, 신뢰성, 오류 및 할루시네이션 여부를 체계적으로 평가할 수 있는 통합 프롬프트를 작성해 보겠습니다.
통합 프롬프트: 생성형 AI가 제공한 정보의 정확성, 신뢰성 및 잠재적 할루시네이션을 평가하기 위한 체크리스트
사실적 오류 또는 왜곡된 정보 확인
제시된 정보에 사실적 오류나 왜곡이 있는지 확인합니다.
해당 정보의 출처와 신뢰성을 평가하고, 다른 공신력 있는 출처와 비교합니다.
논리적 모순, 비약 또는 중요 정보 누락 여부 확인
제시된 정보에 논리적 모순이나 근거 없는 비약이 있는지 확인합니다.
중요한 맥락이나 배경 정보가 누락되어 있는지 확인합니다.
주관적 의견, 편향 및 가정 식별
제시된 정보에 주관적 의견이나 특정 관점의 편향이 포함되어 있는지 확인합니다.
암묵적인 가정이나 전제가 있는지 식별합니다.
AI 할루시네이션 및 가상 정보 점검
제시된 정보가 실제 세계에서 발생 가능한지 확인합니다.
과장되거나 허구적인 부분이 있는지 점검합니다.
공인된 데이터베이스, 공식 기록 또는 경험적 증거를 통해 정보를 검증합니다.
방법론 투명성 및 출처 신뢰성 평가
생성형 AI가 정보를 수집, 종합 및 제시하는 데 사용한 방법론을 기술합니다.
각 출처의 전문성, 신뢰성 및 잠재적 편향을 평가합니다.
정보 제공의 시간성 및 버전 확인
제시된 정보의 게시 날짜나 버전을 확인합니다.
빠르게 변화하는 주제인 경우, 최신 업데이트 또는 버전을 표시합니다.
전문가 의견 및 역사적 맥락 포함
해당 분야의 전문가 의견을 요약하고, 가능한 경우 직접 인용합니다.
정보를 역사적 맥락에 위치시키고, 시간에 따른 이해의 진화를 설명합니다.
개선이 필요한 부분에 대한 피드백 제공
평가 결과를 요약하고, 정보의 질을 높이기 위해 개선이 필요한 영역을 지적합니다.
이 통합 프롬프트를 사용하면 생성형 AI가 제공한 정보의 정확성, 신뢰성, 오류, 편향 및 잠재적 할루시네이션을 체계적으로 검토할 수 있습니다. 또한 정보의 맥락과 방법론에 대한 투명성을 높일 수 있으며, 전문가 의견과 역사적 배경을 포함시켜 더 풍부한 정보를 제공할 수 있습니다.

Gemini

생성형 AI 정보 평가: 포괄적인 프롬프트
다음은 생성형 AI 모델이 제공하는 정보를 평가하기 위해 두 가지 접근 방식의 장점을 결합한 포괄적인 지침 프롬프트입니다:
정보 평가:
다음 기준을 사용하여 [주제]에 대한 제공된 정보를 평가하십시오.
1. 출처 검증:
이 정보를 생성하는 데 사용된 출처를 식별합니다.
출처가 신뢰할 수 있고 신뢰할 수 있습니까 (학술 저널, 공식 보고서, 기존 웹사이트)?
이러한 출처와 관련된 잠재적인 편향이나 한계가 있습니까?
2. 증거 및 정확성:
데이터나 연구로 주장을 뒷받침하십시오.
정보는 이 분야의 확립된 지식과 결과와 일관됩니까?
데이터가 불완전하거나 논란의 여지가 있는 영역을 강조합니다.
3. 적시성 및 최신성:
정보의 출판 날짜 또는 버전을 표시합니다.
빠르게 변화하는 주제의 경우 최신 정보를 확인하려면 마지막 업데이트를 언급하십시오.
4. 오류 식별:
주제와 관련된 잠재적인 사실 오류나 일반적인 오해를 식별하십시오.
이러한 문제를 해결하기 위한 설명이나 설명을 제공합니다.
5. 비판적 사고:
정보 내의 잠재적인 편향, 가정 또는 주관적인 의견을 평가합니다.
추가 검증 또는 조사가 필요한 주장이 있습니까?
6. 완전성:
정보가 주제의 모든 관련 측면을 다루는지 또는 누락된 중요한 세부 정보가 있는지 평가합니다.
7. 환각 확인:
그럴듯하지 않거나 근거가 없는 주장을 식별합니다.
검증 방법(데이터베이스, 공식 기록, 경험적 증거)을 제시합니다.
8. 투명성:
정보를 수집하고 종합하는 데 사용된 방법론을 설명합니다.
AI 프로세스와 관련된 모든 한계 또는 불확실성 영역을 설명합니다.
정보가 개선될 수 있거나 추가 설명이 필요한 영역에 대한 피드백을 제공하고 평가를 요약하십시오.
추가 고려 사항:
가능한 경우 AI가 제공하는 정보를 교과서,査読論文, 전문가 의견과 같은 기존 리소스와 비교하십시오. 차이점이나 불일치 사항을 강조합니다.
역사적 맥락을 사용하여 시간이 지남에 따라 주제에 대한 이해가 어떻게 발전했는지 이해합니다.
생성형 AI는 아직 개발 중입니다. 여러 출처를 사용하여 정보를 확인하고 비판적으로 생각하는 것이 AI 모델의 정보를 기반으로 정보에 입각한 결정을 내리는 데 중요합니다.
이러한 지침을 따르면 생성형 AI가 제공하는 정보의 강점과 약점을 더 깊이 이해할 수 있으며, 이를 통해 신뢰할 수 있는 데이터를 기반으로 정보에 입각한 결정을 내릴 수 있습니다.

사실 어떤 것이 옳은지 다시 테스트하지는 못할 것 같지만, 대표적인 생성형 AI의 각기 다른 질문 이해와 답변에 대해서는 충분히 고민하지 않으면 안될 듯 하고, 무조건적인 신뢰보다는 점검, 확인을 위한 장치를 스스로 마련하지 않으면 안된다는 점만은 분명할 것이다.

이를 위해서 위의 내용을 참고한 custom instruction을 제대로 만들어서 활용하면 문제를 줄이는데 도움이 되지 않을까 싶어서 정리를 했습니다.

#10기교강사방

#프롬프트 엔지니어링 공부하기

#챗GPT 오류

5
4개의 답글

👉 이 게시글도 읽어보세요