본문 바로가기

OS & network/cloud

OCI 생성형 AI, 온디맨드 모드에서 AI 가이드라인 지원(26년 2월 9일)

테크넷 마스터 김재벌 입니다.

 

OCI의 Generative AI , 온디맨드 모드에서 콘텐츠 검열(CM), 프롬프트 삽입(PI) 및 개인 식별 정보(PII)에 대한 AI 보호 기능을 활성화할 수 있습니다. (2026년 2월 9일 서비스 출시)

 

이 기능은 상용 지역의 온디맨드 채팅 및 텍스트 삽입 모델에 대한 API를 통해 사용할 수 있습니다.

 

주요 특징은 아래와 같습니다.

콘텐츠 검열
내부 모델을 사용하여 혐오 발언, 괴롭힘, 폭력, 노골적인 콘텐츠와 같은 유해한 내용을 질문과 답변에서 분류하는 것을 목표로 합니다. 

분류 체계는 이진 범주(전체: 유해한 언어 사용, 차단 목록: 미리 정의된 차단 단어)를 포함합니다.

 

프롬프트 인젝션 방어
이 시스템은 프롬프트 및 내장된 컨텍스트(예: 문서 내에 숨겨진 경우)에서 악의적인 지침을 탐지하여 무단 변경을 방지하는 것을 목표로 하며, 위험도를 이진 점수(안전 0, 위험 1.0)로 제공합니다.

 

개인 식별 정보 및 개인정보 보호
이름(PERSON), 이메일 주소(EMAIL), 전화번호(TELEPHONE_NUMBER) 등과 같은 민감한 데이터를 식별하는 것을 목표로 합니다.

결과에는 감지된 텍스트, 레이블, 위치(오프셋 및 길이), 신뢰도 점수와 같은 세부 정보가 포함됩니다.

예를 들어 데이터에 Jane Smith가 있는 경우 다음과 같은 결과가 나타날 수 있습니다

{"length": 10, "offset": 0, "text": "Jane Smith", "label": "PERSON", "score": 0.9990621507167816}

 

사용 옵션


온디맨드 모델(API 전용)
엔드포인트 없이 실시간으로 평가하려면 ApplyGuardrails API를 사용하여 추론과 함께 입력을 확인합니다.

이 기능은 상용 지역에서 OCI Generative AI가 제공하는 모든 채팅 및 임베디드 모델에 적용됩니다.

기본적으로 차단 없이 중재 범주, 개인 식별 정보(PII) 항목, 프로그래밍 방식 처리를 위한 개인정보 보호 점수와 같은 자세한 결과를 반환합니다.

 

 

생성형 AI에서 가장 문제되는 것이 보안이고, 정보유출인데, AI가이드라인을 이용하면 보다 안전하게 사용할 수 있겠네요.:-)

이 서비스는 26년 2월 9일 출시 되었어요~^^