AI vs ML vs DL: 기술 계보도와 개발자를 위한 학습 로드맵
1. 프롤로그 - "우리 서비스에도 AI를 넣어보자"
창업 초기, 투자자 미팅을 다녀온 후 눈을 반짝이며 생각했습니다. "우리 서비스에도 AI 기능 하나 넣어보자. 요즘 AI 없으면 투자받기 힘들다더라."
백엔드 개발자인 제 머릿속은 복잡해졌습니다. "AI? 그럼 챗봇을 만들어야 하나? 아니면 추천 시스템? 텐서플로우(TensorFlow)를 공부해야 하나? 아니면 그냥 엑셀로 통계 내는 것도 AI인가? ChatGPT API만 붙이면 되는 건가?"
구글링을 해보니 혼란은 더 가중되었습니다. 어떤 글은 "머신러닝 알고리즘"이라 하고, 어떤 글은 "딥러닝 모델"이라 하고, 어디서는 그냥 "AI 기술"이라고 퉁쳤습니다. 도대체 이 셋은 뭐가 다르고, 우리 서비스에는 뭘 써야 할까요?
이 글은 그 혼란 속에서 제가 정리한 "비전공자도 이해할 수 있는 AI 계보도"이자, "AI를 도입하려는 개발자를 위한 가이드"입니다. 미디어의 화려한 용어에 속지 않고 기술의 본질을 꿰뚫어 봅시다.
2. 처음엔 뭐가 이해가 안 갔나
가장 헷갈렸던 건 "경계"였습니다.
- "알파고는 딥러닝인가? 머신러닝인가? AI인가?" (정답: 셋 다 맞음)
- "내가 짠
if (user.age > 19) return 'adult'코드도 AI라고 할 수 있나?" (정답: 아주 넓은 의미에선 맞음) - "머신러닝을 하려면 무조건 딥러닝을 배워야 하나?" (정답: 아님. 엑셀로도 가능함)
특히 미디어에서 이 용어들을 마구잡이로 섞어 쓰다 보니, 마치 서로 다른 기술 3개가 경쟁하는 것처럼 착각했습니다. 하지만 공부를 해보니 이들은 경쟁 관계가 아니라 포함 관계였습니다.
3. 어떤 포인트에서 이해가 됐나
이 관계를 가장 완벽하게 설명해준 비유는 "러시아 인형(마트료시카)"였습니다.
포함 관계의 시각화
가장 큰 인형 안에 중간 인형이 있고, 그 안에 작은 인형이 있는 구조입니다. 그리고 최근에는 그 안에 아주 특별한 더 작은 인형이 하나 더 생겼습니다.
- AI (인공지능): 가장 바깥쪽의 큰 인형. "사람처럼 똑똑해 보이는 모든 것".
- ML (머신러닝): AI 안에 들어있는 중간 인형. "데이터를 통해 스스로 학습하는 방식".
- DL (딥러닝): ML 안에 들어있는 작은 인형. "인공신경망(Neural Network)을 통해 학습하는 방식".
- GenAI (생성형 AI): DL의 최신 트렌드. "판별을 넘어 새로운 콘텐츠를 만들어내는 방식".
graph TD
subgraph "Artificial Intelligence (AI)"
subgraph "Machine Learning (ML)"
subgraph "Deep Learning (DL)"
subgraph "Generative AI (GenAI)"
G[GPT, DALL-E, Claude, Llama]
end
D[Neural Networks (CNN, RNN, Transformer)]
end
M[Decision Trees, SVM, Naive Bayes, Linear Regression]
end
R[Rule-based AI / Symbolic AI]
end
style G fill:#f9f,stroke:#333
style D fill:#f96,stroke:#333
style M fill:#69f,stroke:#333
style R fill:#9f6,stroke:#333
이 그림이 머릿속에 잡히자 모든 의문이 풀렸습니다. "아, 챗GPT(GenAI)는 딥러닝의 일종이고, 딥러닝은 머신러닝의 부분집합이구나. 그리고 AI는 이 모든 걸 포괄하는 개념이구나."
4. 깊게 파고들기 - 각 계층의 정체와 Transformer
Layer 1: AI (Artificial Intelligence) - 1950s~
초기의 AI는 GOFAI (Good Old-Fashioned AI) 또는 Symbolic AI라고 불렸습니다. 쉽게 말해 "인간이 규칙을 하나하나 코딩해주는 것"입니다.
- 예시: 체스 게임. "폰이 여기 있으면 저기로 움직여라"라는 수만 가지 경우의 수를 if문으로 짭니다. 전문가 시스템(Expert System)도 여기에 속합니다.
- 한계: 규칙이 명확하지 않은 것(예: 고양이 사진 구별, 사람의 필기체 인식)은 코딩할 수 없습니다. 세상은 if문으로 정의하기엔 너무 복잡하니까요.
Layer 2: Machine Learning (머신러닝) - 1980s~
"규칙을 코딩하지 말고, 데이터를 던져주고 기계가 스스로 규칙을 찾게 하자" (Software 2.0). 개발자는 "고양이의 특징(귀가 뾰족함)"을 코딩하지 않습니다. 대신 "고양이 사진 1만 장"과 "개 사진 1만 장"을 줍니다(Labeling). 기계는 통계적인 기법을 이용해 데이터 속에서 패턴(규칙)을 찾아냅니다. 이를 학습(Training)이라고 합니다.
- 주요 알고리즘: Decision Tree(스무고개), Random Forest, SVM, K-Means Clusering.
- 한계: 사람이 데이터를 기계가 이해하기 좋게 가공하는 "특징 추출(Feature Engineering)" 과정을 직접 해줘야 했습니다. 예를 들어 이미지의 윤곽선을 따서 넣어줘야 했죠.
Layer 3: Deep Learning (딥러닝) - 2010s~
"특징 추출조차 기계가 알아서 하게 하자" 인간의 뇌세포(뉴런) 구조를 모방한 인공신경망(ANN)을 씁니다. 데이터 양이 폭발적으로 늘어나고(Big Data), GPU 성능이 좋아지면서 가능해졌습니다. 가장 큰 차이점은 "사람의 개입이 최소화된다"는 점입니다. 그냥 생 사진(Raw Data)을 던져주면, 신경망의 깊은 층(Deep Layer)들이 알아서 선 -> 면 -> 눈/코/입 -> 얼굴 순으로 특징을 스스로 학습합니다(Representation Learning).
- 주요 아키텍처:
- CNN (Convolutional Neural Network): 이미지 처리에 특화. 필터(Filter)를 이용해 이미지의 특징을 훑습니다.
- RNN (Recurrent Neural Network): 시계열 데이터(음성, 텍스트) 처리에 특화. 이전 정보를 기억했다가 다음 예측에 사용합니다.
Layer 4: Transformer와 Generative AI (생성형 AI) - 2017s~
여기서 혁명이 일어납니다. 구글이 발표한 논문 "Attention Is All You Need"가 세상을 바꿨습니다.
- Transformer 아키텍처: 기존 RNN은 문장을 순서대로 읽어서 처리 속도가 느리고(병렬 처리 불가), 문장이 길어지면 앞 내용을 까먹는(Long-term Dependency) 문제가 있었습니다. Transformer는 문장 전체를 한꺼번에 입력받고, 단어들 사이의 관계(Attention)를 병렬로 계산합니다.
- Self-Attention: "The animal didn't cross the street because it was too tired." 라는 문장에서 'it'이 무엇을 가리키는지(animal vs street) 문맥을 파악하는 능력이 비약적으로 상승했습니다.
- GenAI: 이 Transformer를 기반으로 인터넷의 거의 모든 텍스트 데이터를 학습(Pre-training)시킨 거대 언어 모델(LLM)이 바로 GPT(Generative Pre-trained Transformer)입니다. 이제 AI는 판별(Classification)을 넘어 창작(Generation)의 영역으로 들어왔습니다.
5. 실제적 적용: RAG vs Fine-tuning
생성형 AI를 도입할 때 창업자가 가장 많이 고민하는 주제입니다. "우리 회사의 데이터를 AI에게 어떻게 가르치지?"
1) RAG (Retrieval-Augmented Generation, 검색 증강 생성)
- 비유: "시험 볼 때 교과서를 펴놓고 보게 하는 것 (Open Book Test)"
- 방식: AI 모델 자체를 학습시키는 게 아닙니다. 질문이 들어오면 우리 회사 DB(Vector DB)에서 관련 문서를 검색(Retreival)합니다. 그리고 그 문서를 참고자료로 프롬프트에 같이 넣어서(Augmented) 답변을 생성(Generation)하게 합니다.
- 장점: 최신 정보를 실시간으로 반영 가능, 할루시네이션(거짓말) 감소, 저렴함, 데이터 보안 우수.
- 추천: 고객 상담 챗봇, 사내 문서 검색기, 법률 판례 검색.
2) Fine-tuning (파인 튜닝, 미세 조정)
- 비유: "학생을 학원에 보내서 특정 과목만 1년 동안 집중 과외시키는 것"
- 방식: 이미 똑똑한 AI 모델(Pre-trained Model)의 파라미터(뇌 구조)를 우리 데이터로 조금 더 학습시켜서 뇌의 일부를 바꿉니다. 지식 주입보다는 말투(Tone & Manner)나 특수한 형식(JSON 구조 등)을 가르칠 때 씁니다.
- 장점: 전문적인 도메인 지식 습득, 일관된 캐릭터성 부여.
- 단점: 비쌈(GPU 비용), 데이터 준비가 힘듦(Quality Data 필요), 재학습 없이는 새로운 지식을 모름.
- 추천: 의료/법률 등 전문 용어 이해가 필수일 때, "반말하는 츤데레 챗봇" 같은 페르소나 필요 시.
결론: 처음엔 99% RAG로 시작하세요. 파인튜닝은 RAG로 안 될 때 고려하는 최후의 수단입니다. RAG가 훨씬 가성비가 좋습니다.
6. AI 윤리와 미래 (Ethical AI)
AI를 도입할 때 기능만 보면 안 됩니다.
- Bias (편향성): 학습 데이터가 백인 남성 위주라면, AI 채용 시스템도 여성이나 유색인종을 차별할 수 있습니다. (실제 아마존 채용 AI 사례)
- Deepfake (딥페이크): 생성형 AI로 만든 가짜 뉴스나 음란물이 사회적 문제가 됩니다. 워터마크 기술이 논의되고 있습니다.
- Explainability (설명 가능성): AI가 대출을 거절했는데 "왜요?"라고 물었을 때 "AI가 98% 확률로 거절하래요"라고 하면 고객은 납득하지 못합니다. XAI (Explainable AI)가 금융/의료 분야에서 중요해지고 있습니다.
7. 개발자를 위한 AI 학습 로드맵
"저도 AI 엔지니어가 되고 싶은데 뭐부터 공부해야 하나요?"
- Level 1 (API Consumer): OpenAI, Claude API를 써서 서비스를 만드는 단계. 프롬프트 엔지니어링(Prompt Engineering) 능력이 중요합니다.
LangChain라이브러리를 배우세요. - Level 2 (Application Engineer): 오픈소스 모델(Llama 3, Mistral)을 로컬에 띄우고(Ollama), RAG 시스템을 구축하는 단계.
Vector DB(Pinecone, Weaviate)와 임베딩(Embedding) 개념을 익히세요. - Level 3 (Model Tuner): 허깅페이스(Hugging Face)에서 모델을 다운받아 파인튜닝(LoRA, QLoRA)을 해보는 단계. PyTorch 기초와 GPU 클라우드 사용법을 알아야 합니다.
- Level 4 (Researcher): 새로운 논문을 읽고 모델 아키텍처를 개선하는 단계. 수학(선형대수, 통계)과 깊은 딥러닝 지식이 필요합니다. (석/박사 과정)
대부분의 웹/앱 개발자는 Level 1~2만 잘해도 엄청난 가치를 만들어낼 수 있습니다. 굳이 수학부터 파지 말고, API부터 호출해보세요.
8. 요약 및 마무리
개발팀 회의 시간, 저는 이제 이렇게 말할 수 있게 되었습니다.
"이번 '악성 댓글 필터링' 기능은 텍스트 데이터니까 딥러닝(BERT)이 정확하겠지만 비용이 든다. 초기엔 규칙 기반(욕설 리스트)으로 막고, 놓치는 건 API(OpenAI Moderation)를 쓰자. 그리고 '사내 규정 챗봇'은 파인튜닝 하지 말고 RAG 방식으로 만들자."
기술의 위계 질서를 알면, 도구를 선택하는 눈이 생깁니다. 무조건 최신 유행인 생성형 AI를 고집할 필요는 없습니다. 문제의 본질을 보고 가장 적합한 "마트료시카 인형"을 꺼내 쓰세요. 그것이 진짜 엔지니어링입니다.