[AI/LLM] In-context learning

2024. 11. 22. 10:55·[ Artificial Intelligence ]/Trend

인 컨텍스트 러닝 in context learning

- 대규모 언어 모델 LLM이 프롬프트 안에 있는 예제 (=context) 기반으로 추론하는 능력

- 학습된 매개변수를 모델이 변경, 재조정 하지 않고 프롬프트에서 제공된 맥락만을 통해 작업을 이해하고 수행하는 방법

 

- 모델이 새로운 데이터나 작업을 수행하기 위해 다시 훈련되는 일 없이 입력된 프롬프트 기반으로 작업을 한다

- 프롬프트 안에 작업의 정의와 몇 가지 입출력 예시를 포함시켜서 가이드를 줄 수 있다

 

- zero shot 작업에 대한 맥락 즉 프롬프트 안에 예시 없이도 일반적인 명령과 질문을 수행

- few shot 프롬프트에 몇 가지 예시를 제공해서 작업을 이해

 

- 모델은 프롬프트 내 정보를 우선적으로 사용하고 그에 더하여 사전 훈련 과정에서 학습한 지식을 사용한다

 

- 모델의 파라미터가 고정된 상태에서 프롬프트의 인풋을 통해 내부에 새로운 규칙을 암묵적으로 학습하게 한다

- 데이터를 출력하는 것이 아니라 입력된 컨텍스트에서 패턴을 식별하고 새로운 예측을 생성하는 것이다

 

자연어 처리 번역 텍스트 요약 감정 분석

데이터 처리 패턴 분석 데이터 요약

 

728x90

'[ Artificial Intelligence ] > Trend' 카테고리의 다른 글

[AI/On-Device AI] 3대 빅테크 기업의 온디바이스 AI 전략  (1) 2024.02.01
[AI/GAN] GAN 적대적 생성 신경망의 개념  (1) 2024.01.21
[AI/Diffusion model] InstantID, 단일 이미지로 다양한 이미지 생성  (1) 2024.01.21
[AI/Vision] Apple의 AIM(대규모 비전 모델)  (1) 2024.01.21
'[ Artificial Intelligence ]/Trend' 카테고리의 다른 글
  • [AI/On-Device AI] 3대 빅테크 기업의 온디바이스 AI 전략
  • [AI/GAN] GAN 적대적 생성 신경망의 개념
  • [AI/Diffusion model] InstantID, 단일 이미지로 다양한 이미지 생성
  • [AI/Vision] Apple의 AIM(대규모 비전 모델)
dev charlotte
dev charlotte
주 - 컴퓨터공학 / 복수 - 산업 보안
    250x250
  • dev charlotte
    int main() {
    dev charlotte
  • 전체
    오늘
    어제
    • 분류 전체보기 N
      • [ Laboratory ] N
        • Paper review
        • Advanced Operating System N
        • System Software & Storage
        • Lab etc
      • [ Computer Science ]
        • Algorithm_C++
        • Operating System
        • Information Retrieval
        • Database_sql
        • SW Engineering
        • Computer Network
        • JavaScript
        • Python
        • Data Structure
        • CS study
        • Distributed systems
      • [ Computer Security ]
        • Convergence Security
        • Web Security
        • PIMS
        • Network Security
        • Digital Finance
      • [ Artificial Intelligence ]
        • Trend
        • Seminar
      • [ 미래, 같이, LG ]
      • [ Development ]
        • [ Front-end ]
        • [ Back-end ] Spring 기본
        • [ Back-end ] Node.js
      • etc
        • 현대오토에버 스마트 모빌리티 공학 체험 교육
      • It's me
  • 블로그 메뉴

    • 링크

      • GitHub
    • 공지사항

    • 인기 글

    • 태그

      싸피
      ssafy 13기
      데이터베이스
      대학생 대외활동
      싸피 13기
      코딩 교육
      프로그래머스 입문
      자바스크립트
      공대생 대외활동
      오블완
      SSAFY
      티스토리챌린지
      프로그래머스
      비전공자 코딩
      백준
      SQL
      현대오토에버 스마트모빌리티
      ACM
      프로그래머스 c++
      현대오토에버
      코딩 인강
      hotstorage
      코드잇
      소프트웨어 공학
      스마트모빌리티공학체험교육
      프로그래머스 코테
      프로그래밍 언어론
      MySQL
      spdk
      현대오토에버 스마트 모빌리티
    • 최근 댓글

    • 최근 글

    • hELLO· Designed By정상우.v4.10.4
    dev charlotte
    [AI/LLM] In-context learning
    상단으로

    티스토리툴바