포스트

AWS TechCamp : Bedrock과 API Gateway

AWS TechCamp : Bedrock과 API Gateway

Amazon Bedrock이란?


  • AWS에서 제공하는 대규모 언어 모델 개발 및 배포 플랫폼
  • 기존에는 GPT-3나 PaLM과 같은 대규모 언어 모델을 개발하려면
    막대한 컴퓨팅 자원과 전문 지식이 필요했으나, 베드록을 사용하면 누구나 쉽게 AI 모델을 구축하고 배포할 수 있다

Bedrock 주요 기능


  1. 사전 학습된 대규모 언어 모델 제공
  2. 간편한 모델 미세 조정(Fine-tuning)
  3. 유연한 모델 배포 옵션
  4. 다양한 AI 활용 사례 지원
  • 생성형 AI의 도전 과제
    • 출력 결과의 신뢰성
    • 데이터 보안
    • 규제 준수와 거버넌스
  • 생성형 AI 애플리케이션의 요청 흐름
    1. prompt 사용자로부터 입력을 받음
    2. 앱이 사용자 입력 및 고객 데이터를 프롬프트로 변환
    3. 생성된 프롬프트를 모델에 전달
    4. 모델 응답 수신
    5. 사용자에게 응답 전송

Amazon API Gateway를 활용한 안전한 생성형 AI 애플리케이션 구성


  • 아마존 API Gateway는 개발자가 어떤 규모에서든 API를 쉽게 생성, 게시, 유지 관리, 모니터링 보호할 수 있게 해주는 완전관리형 서비스
  • 사용자 인증, 인가, 감사 및 모니터링, 암호화, 외부노출 최소화 및 취약점 관리
  • AI 정책에 따른 유해 컨텐츠 필터링, 민감 정보 삭제, 특정 주제 허용, 차단

Amazon Bedrock 기반 책임감 있는 생성형 AI 구성 및 데모


실습 페이지 링크

  • Amazon Bedrock 가드레일
  • 애플리케이션 요구 사항과 책임있는 AI 정책에 따라 맞춤화된 보호 기능 구현
  • 콘텐츠 필터, 단어 필터
  • 자동 추론

RAG 및 GraphRAG 마스터하기


  • RAG(Retrieval-Augmented Generation) : 대규모 언어 모델의 출력을 최적화하여 응답을 생성하기전에 학습 데이터 소스 외부의 신뢰할 수 있는 지식 베이스를 참조하도록 하는 프로세스

  • 전통적 파인 튜닝 문제를 해결하기 위한 방법

벡터 거리 검색 방법 : ANN(Approximate Nearest Neighbor) 알고리즘

  • 인덱스를 더 효율적으로 재구성
  • 검색 가능한 벡터의 차원을 줄여 속도를 높임
  • 정확도를 희생하고 검색속도가 크게 향상
  • 수십만개 이상 벡터 검색 시 사용
  • Graph-based(HNSW), Cluster-based(IVF) 를 가장 많이 씀
  • nmslib, Lucene, faiss 라이브러리 형태로 제공

RAG & Graph RAG 구현하기

이쪽 백엔드는 다뤄본적이 없어서 이해하는데 애먹었다

추후 다시 확인하고 정리할 예정

이 기사는 저작권자의 CC BY 4.0 라이센스를 따릅니다.