LGCNS GoogleCloud LLM Hackathon 후기

AI * ML

LGCNS GoogleCloud LLM Hackathon 후기

armyost 2024. 7. 7. 23:27

728x90

AI의 발전과정

초거대 AI
> 생성형 AI
> 다양한 형태의 데이터를 학습하는 AI = Multimodal AI

거짓정보생성(Hallucination)
실제로 사실과 다르거나 존재하지 않는 정보를 생성하는 것

→ 왜 일어나는지?
- 불충분한 학습 데이터 : 생성형 AI는 특정기간 까지의 인터넷 , 책, 신문 기사 등에 서 수집된 대량의 텍스트를 학습
- 질문의 맥락 이해 부족 : 생성형 ai가 질문을 제대로 이해하지 못해서 엉뚱한 답변을 생성
- 생성형 AI의 본질은 ' 다음 단어 예측' : 지식을 학습하는 것이 아닌 데이터와 통계를 통해 다음단어를 예측합니다.

→ 어떻게 해결하나?
- RAG : 검색증가 생성
- RLHF : 인간피드백기반 강화학습

RAG : Retrieval Augmented Generation
Retrieval : 질의에 필요한 정보를 추출하는것
Prompt : 생성형 AI를 작동시키기 위한 입력값

Retriever
Chunking, Overlapping > Embedding Model 에 넣어서 텍스트의 의미를 숫자(Dense Vector)로 바꾸는 작업
ANN, 코사인, 유클리트 거리, 자카드 유사도 기법이 있음

LLM이 비즈니스 서비스로 가치를 만들기 위한 넘어야할 고비

최적화 되지 않은 프롬트프로 인하여 만족스럽지 않은 답변을 받게 되는것
Why?
생성형 AI는 코드가 아닌 자연어로 명령 : 코드의 경우 정해진 문법에 맞춰 작성하면 되지만 생성형 ai는 자연어로 명령하기 때문에 다양한 케이스가 존재할 수 있음
생성형 AI 모델의 한계 : 학습의 한계로 매우 복잡하저거나 창의적인 문제 수학적인 문제해결에는 어려움이 존재함
결과값 범위제어 불가 : 사용자 별로 최적화 되어 있는 결과 범위를 생성형 AI스스로 도출하기 어려움

How?
- 프롬프트 엔지니어링 : 원하는 응답을 유도하기 위한 프롬프트를 만드는 과정

- 하이퍼 파라미터 적용

※ 프롬프트 구성요소
필수 : 페르소나, 컨텍스트, Task, 형식
선택 : 예시, Follow up, 제약 조건

※ chain of thought 기법은 이전 질문의 대답을 기반하여 다음 대답에 사용

정답은 반복하고 실행하고 계선하고 반복하고 실행하고 개선하는것이 답이다.

하이퍼파라미터 조정
- temperature : 창의성과 일관성을 결정짓는 값이다.
1) temperature 값을 높이면 선택의 여지를 넓혀서 낮은 확률의 답변도 출력할 수 있다.
2) Top K : 출력할 토큰 후보중 상위 k개의 토큰결과를 출력후보로 설정 . temperature 를 매우 높게 설정하면 생성된 문장이 맥락을 크게벗어나거나 잘못된 글자를 출력할 수 있어 주로 사용
3) Top P : 출력할 토큰후보중 확률의 합이 p가 될때까지지의 출력후보 결정, 높을수록 무작위성 증가

도메인 특화 지식 부재
생성형 ai가 의료 건설 등 특정 분야나 전문 영역 세부 task에 대한 깊이 있는 지식이 부족한 현상

full fine tuning : 이미 학습된 모델의 전체 파라미터를 특정데이터에 맞춰서 재학습.
장점 : 최적의 성능
단점 : 많은데이터, gpu필요

구글에는 이미 fine tuning 된 모델이있음.

PEFT(Parameter Efficient Fine Tuning) : Lay사이에 Adapt Layer를 추가하여 일부 매개변수만 업데이트

윤리 및 보안
잘못된 정보 제공, 사이버 보안 위협코드 작성, 기밀 유출 등 생성형 AI로 인한 보안 위협 요소 발생

Why?
- 편향된 데이터와 알고리즘 : 데이터와 알고리즘이 특정 방향으로 편향된 결우 결과물 역시 편향된 결과를 초래함
- 민감 데이터 사용 : 암호화가 부족한 데이터가 사용될 경우 개인의 프라이버시를 침해할 수 있음
- 책임 주체 모호성 : 생성형 ai가 생성한 결과물에 대해서 문제가 발생할 경우 책임 주체가 불분명함.

How?
- 개인 정보 마스킹
- 활용정책 및 프로세스 수립
- 사용자 교육
- 답변검증
- 개인정보 민감정보 처리

'AI * ML' 카테고리의 다른 글

Google Cloud Summit Seoul 2024 후기 (0)	2024.07.07
LangChain 기본 - 검색기(Retriever) (0)	2024.07.03
LangChain 기본 - 임베딩(Embedding), 벡터저장소(VectorStore) (0)	2024.07.03
LangChain 기본 - 체인(Chains) (0)	2024.07.03
LangChain 기본 - RAG에 대해 (0)	2024.06.30

현재글LGCNS GoogleCloud LLM Hackathon 후기

StarLord