이 리포지토리에는 Azure OpenAI에서 제공하는 GPT(Generative Pre-trained Transformer)를 사용하는 기본 방법을 이해하고 샘플 솔루션을 및 다양한 사용 사례를 통해 이해에 도움이 되는 리소스가 포함되어 있습니다.
AI Tour "실전 RAG 정복하기" PDF 파일을 공유 드립니다.
Codespace 환경을 통해서 개발 환경을 빠르게 시작할 수 있습니다.
아래 버튼을 클릭하여 GitHub Codespaces에서 저장소를 열어서 시작하세요!
Python 실행을 위한 Runtime 환경은 python=3.11.4
추천합니다. 위 버튼을 누르고 약 7분이 경과되면, .devcontainer에 정의된 개발 환경 및 라이브러리 설치가 완료되며, 브라우저에 Visual Studio Code IDE가 표시됩니다.
현재 여기의 샘플은 주로 GPT-4o를 기반으로 합니다. gpt-4o 최신 버전에서 테스트 되었습니다. OpenAI의 모델 정책에 맞추어 Chat Completion API 기반으로 실습할 수 있습니다. gpt-4o-mini 모델 또는 gpt-4o 최신 모델을 활용하는 것을 추천 드립니다. (2024-12-19 기준)
안전한 로컬 환경에서의 키관리를 위해 실습에 필요한 API Endpoint 또는 API Key는 .env 파일을 활용하는 것을 강력히 추천합니다. 예를 들어 .env.sample 파일을 복사하여
.env
파일을 만들고 해당 API KEY 정보를 입력하여 사용합니다.
Python 버전은 3.11.4, Azure OpenAI 버전은 1.13.3에서 실행할 수 있습니다. - 2024-03-17
해당 컨텐츠는 DevContainer 기반으로 개발에 필요한 환경설정이 정의되어져 있습니다. GitHub Codespace를 활용하거나, 로컬에 Docker를 설치한 상태에서 Visual Stduio Code IDE에 해당 Repository를 다운로드 받을 경우, 자동으로 컨테이너에 개발환경(Python Runtime 3.11.4, Azure OpenAI 1.13.3)을 설치합니다. .env 파일에 필수 API 정보를 입력하고 저장후 사용하세요.
나만의 Jarvis 비서
만들기가 추가되었습니다. 외부 API를 말로 쉽게 호출하여 사용할 수 있습니다. 실습이동
GPT(Generative Pre-trained Transformer)는 OpenAI에서 개발한 LLM(Large Language Model)입니다. 트랜스포머 아키텍처 기반의 딥러닝 모델입니다. 자세한 내용은 OpenAI를 참조하세요. 간단하게 정리된 문서는 다음을 참고하세요.
다음의 순서로 GPT를 학습할 수 있습니다.
-
(개발자) Prompt Engineering - Quick Start: GPT 사용을 빠르게 시작할 수 있는 노트북 모음입니다.
이 워크샵은 스스로 학습할 수 있는 교육용 영상을 무료로 배포합니다. 해당 영상은 2024년 9월에 시리즈 형태로 정리하여 게재될 예정입니다.
Python 코드 기반으로 프롬프트 엔지니어링을 하는 방법을 소개합니다. 해당 영상은 Python Runtime 3.11.4, Azure OpenAI 1.13.3 버전의 환경에서 실행할 수 있도록 소스 코드(GitHub Repository)와 개발환경 세팅(DevContainer) 정보를 동시에 포함하고 있습니다. 빠른 개발환경을 위해서는 GitHub의 Codespace 기반으로 개발 환경을 구축하고, 웹브라우저 상에서 Visual Stduio Code IDE와 동일하게 개발하고 테스트 할 수 있습니다.
별도의 프로그래밍 지식이 없더라도 나의 데이터를 조회하고 답변을 만들 수 있는 서비스를 만들 수 있습니다. 임베딩 되어 있는 Wikipedia 문서를 벡터DB에 색인화하고, Azure OpenAI의 On your data 기능으로 Playground에서 챗봇 서비스를 즉시 생성하는 방법을 설명합니다. OpenAI에서 제공하는 text-embedding-ada-002 API 기반으로 사전에 Wikipedia 정보를 Vector화 한 데이터의 일부분을 Azure AI Search 서비스에 인덱싱하고, Azure OpenAI Studio Playground 에서 on your data 로 연결하여 챗봇 서비스를 즉시 활용할 수 있는 방법을 다룹니다.
LLMOps를 위한 도구인 Prompt flow를 설명하고, 질문을 하면, 위 영상에서 색인화된 벡터DB를 조회하여 원하는 답변을 생성하는 RAG 기반의 API를 생성하고 테스트 하는 방법을 소개합니다. Codespace 기반 실습을 위해서는 https://github.com/HyounsooKim/promptflow-kr (Legacy) 리포지토리를 활용할 수도 있습니다.
Azure AI Studio에서 LLMOps를 위한 도구인 Prompt flow를 활용하여, 위 영상에서 색인화된 벡터DB를 조회하여 원하는 답변을 생성하는 RAG 기반의 API를 생성하고 테스트 하는 방법을 소개합니다.
해당 실습을 원활하게 제공하기 위해서 .devcontainer 환경을 제공하고 있습니다. 나의 PC에 Docker나 IDE 설치를 원하지 않는다면,
Codespace
를 권장합니다.
- Local PC에
Docker
가 설치되어 있다면, VS Code에서 Reopen DevContainer를 실행하여 Docker에 컨테이너 이미지를 생성하면 자동으로 실습 가능한 런타임과 패키지들이 설치되도록 구성되어 있습니다. - GitHub에서 제공하는
Codespace
를 활용하면, Codespace가 제공하는 리모트 VM에 컨테이너가 올라가고, Codespace가 제공하는 웹브라우저 용 VS Code를 통해 즉시 개발을 진행할 수 있습니다.
참고: Codespace
는 GitHub 개인 계정에게 월 15GB의 저장공간과 120 시간/core의 VM을 무료로 제공합니다. 자세한 가격 정보 참고는 클릭
이 Repository는 https://github.com/Azure/azure-openai-samples 을 기반으로 만들었습니다.
2023년 7월 우아한형제들
의 생성형 AI 해커톤 대회인 우아톤 2023을 기점으로 시작되었습니다. 2023년 5월부터 컨텐츠 제작을 하여, 2023년 7월부터 2024년 4월까지 1,000명이 넘는 분들과 함께 프로그램이 진행되었습니다. Origin Repo가 아닌 별도의 Repo로 분기한 이유는 한국 환경에 맞게 지속적으로 업데이트가 되면서 통합 보다 독립 시키는 것이 한국 고객에게 더 나을 것이라는 판단 때문입니다. 이 프로그램은 무료이며, 2일간의 Prompt Engineering Workshop 교육에서 이틀차 오전 교육용입니다. 오후 과정은 Prompt flow Quick Start로 이어지며, LLMOps 기반의 App 제작 방법을 배울 수 있습니다. 교육 이후, 추가의 2~3일간 해커톤(Hackathon)을 통해 Gen AI 기반의 MVP 모델을 빠르게 Prototyping 하는 것을 목표로 합니다. 프로그램에 대한 소개 문서를 통해서 행사 정보를 얻을 수 있습니다.
Gen AI Workshop & Hackathon
을 진행한 고객 중 공개된 회사에 대해서만 아래에 관련 정보를 기록합니다.
- 2023-07: 우아한형제들 - 우아한형제들, 사내 해커톤 ‘우아톤 2023’ 진행
- 2024-01: Finda - 핀다, 한국MS와 사내 해커톤 '2024핀다톤' 개최
- 2024-07: 인터파크 트리플 인터파크트리플, 사내 해커톤 '인트톤 2024' 진행
We welcome contributions to this repository. If you have any ideas or suggestions, please feel free to open an issue or submit a pull request.
As technologies changes very fast, we endevour to keep this repository updated as quick as possible. However, this is heavily rely on keen community contributors to make this happen.