2026년 4월 27일
CS / Theory[AI] 인공지능
AI라는 말을 일상에서 자주 듣게 되었지만, 막상 인공지능이 무엇인지 설명하려고 하면 생각보다 쉽지 않다. 특히 인공지능, 머신러닝, 딥러닝은 비슷한 의미로 사용되는 경우가 많지만, 실제로는 포함 관계가 있는 서로 다른 개념이다.
이번 글에서는 인공지능의 기본 개념과 종류, 그리고 머신러닝과 딥러닝의 차이를 정리해보려고 한다.
목차
[1] 인공지능
[2] 머신러닝과 딥러닝
[3] 인공지능의 필수 구성 요소
[1] 인공지능
1) 개념
인공지능(Artificial Intelligence)이란?
인간의 지능적인 활동을 모방하거나 수행할 수 있도록 만드는 기술 분야
여기서 지능적인 활동이란 학습, 추론, 문제 해결, 언어 이해, 사물 인식 등을 포함한다.
쉽게 말하면 인공지능은 단순히 사람이 입력한 명령만 수행하는 프로그램이 아니라, 데이터를 바탕으로 판단하고 문제를 해결할 수 있는 시스템을 만드는 것을 목표로 한다.
예를 들어 다음과 같은 서비스들은 모두 인공지능이 활용된 사례라고 볼 수 있다.
- 유튜브, 넷플릭스, 스포티파이의 콘텐츠 추천
- 시리, 빅스비, 구글 어시스턴트 같은 음성 비서
- 번역기와 챗봇
- 자율주행 자동차의 차선 유지, 주차 보조, 충돌 방지 기능
- 사진 앱의 얼굴 인식 기능
즉, 인공지능은 더 이상 먼 미래의 기술만이 아니라, 우리가 매일 사용하는 서비스와 기기 속에 자연스럽게 들어와 있는 기술이다.
2) 구분
- 좁은 인공지능(Narrow AI): 특정 도메인이나 산업 분야에 특화된 인공지능
- 범용 인공지능(Artificial General Intelligence, AGI): 인간과 유사한 수준의 지능을 갖춘 인공지능
| 구분 | 좁은 인공지능 | 범용 인공지능 |
|---|---|---|
| 특징 | 정해진 영역에서는 높은 성능을 보이지만, 다른 영역으로 확장하기 어렵다 | 새로운 상황을 이해하고 스스로 학습하며 여러 문제를 해결할 수 있다 |
| 현재 상태 | 현재 대부분의 AI가 여기에 해당한다 | 아직 완전히 실현되지 않았다 |
| 예시 | 추천 알고리즘, 음성 비서, 번역기, 자율주행 보조 기능 | 영화나 소설 속 인간 수준의 AI |
현재 우리가 사용하는 대부분의 인공지능은 좁은 인공지능에 해당한다. 예를 들어 유튜브 추천 알고리즘은 영상을 추천하는 일에 특화되어 있고, 음성 비서는 사용자의 음성 명령을 이해하고 처리하는 일에 특화되어 있다.
반면 범용 인공지능은 인간처럼 여러 분야의 문제를 이해하고 해결할 수 있는 인공지능을 의미한다. 하지만 진정한 의미의 범용 인공지능은 아직 현실 세계에 존재하지 않는다.
최근에는 대화 능력과 물리적 작업 수행 능력을 결합한 휴머노이드 로봇들이 등장하고 있다. 이러한 사례들은 인공지능이 앞으로 어떤 방향으로 발전할 수 있는지 보여주는 예로 볼 수 있다.
[2] 머신러닝과 딥러닝
1) 머신러닝
머신러닝(Machine Learning)이란?
컴퓨터가 데이터를 분석하고, 그 안에서 패턴이나 규칙을 찾아 스스로 학습하도록 하는 방법
사람이 모든 규칙을 직접 작성하는 것이 아니라, 데이터를 통해 컴퓨터가 규칙을 찾아내도록 한다는 점이 핵심이다.
예를 들어 스팸 메일을 분류하는 시스템을 생각해볼 수 있다.
사람이 직접 "이 단어가 들어가면 무조건 스팸이다"라고 모든 규칙을 작성하는 것은 어렵다. 대신 머신러닝 모델은 수많은 메일 데이터를 학습하면서 어떤 메일이 스팸일 가능성이 높은지 판단하는 기준을 만들어간다.
머신러닝에서는 데이터의 특징을 잘 찾는 것이 중요하다. 여기서 특징, 즉 Feature는 데이터를 설명하는 의미 있는 정보를 말한다.
예를 들어 집값을 예측하는 모델을 만든다면 다음과 같은 정보가 특징이 될 수 있다.
- 집의 크기
- 방의 개수
- 위치
- 건축 연도
- 주변 교통 환경
모델은 이런 특징을 바탕으로 집값과 관련된 패턴을 학습한다.
2) 딥러닝
딥러닝(Deep Learning)이란?
머신러닝의 한 분야로, 인간의 뇌 구조를 모방한 인공신경망을 활용하여 컴퓨터가 데이터를 학습하는 방법
인공신경망(Artificial Neural Network)이란?
인간 두뇌의 신경망 구조에서 영감을 받아 설계된 컴퓨팅 시스템
여러 층으로 구성된 인공 뉴런인 노드(Node)들이 서로 연결되어 데이터를 입력받고 처리하여 결과를 출력하는 구조
입력층 (Input Layer) 은닉층 (Hidden Layer) 출력층 (Output Layer)
● ● ●
● ------------------------> ● ------------------------> ●
● ------------------------> ●
● ------------------------> ●
●딥러닝의 가장 큰 특징은 사람이 직접 특징을 하나하나 정해주지 않아도 된다는 점이다.
머신러닝에서는 사람이 중요한 특징을 어느 정도 직접 정리해주어야 하는 경우가 많다. 하지만 딥러닝은 데이터를 학습하는 과정에서 모델이 중요한 특징을 스스로 찾아낼 수 있다.
예를 들어 강아지와 고양이를 구분하는 모델을 만든다고 가정해보자.
머신러닝에서는 귀 모양, 눈 모양, 털 색깔, 얼굴 형태 같은 특징을 사람이 어느 정도 정리해야 할 수 있다. 반면 딥러닝에서는 수많은 강아지와 고양이 이미지를 학습하면서 모델이 스스로 구분에 필요한 특징을 찾아낸다.
인공지능, 머신러닝, 딥러닝의 관계
인공지능, 머신러닝, 딥러닝은 서로 완전히 다른 개념이 아니라 포함 관계에 있다.
AI ⊃ 머신러닝 ⊃ 딥러닝
즉, 인공지능이 가장 넓은 개념이고, 머신러닝은 인공지능을 구현하는 방법 중 하나이다. 딥러닝은 다시 머신러닝 안에 포함되는 한 분야이다.
[3] 인공지능의 필수 구성 요소
인공지능이 제대로 작동하기 위해서는 몇 가지 핵심 요소가 필요하다. 대표적으로 데이터, 알고리즘, 컴퓨팅 자원, 모델이 있다.
데이터 → 알고리즘 → 컴퓨팅 자원 → 모델
1) 데이터
데이터는 인공지능 학습의 재료이다.
인공지능은 데이터를 바탕으로 패턴을 찾고, 그 패턴을 이용해 예측이나 판단을 수행한다. 따라서 어떤 데이터를 사용하느냐에 따라 인공지능의 성능이 크게 달라질 수 있다.
데이터는 크게 정형 데이터와 비정형 데이터로 나눌 수 있다.
| 구분 | 설명 | 예시 |
|---|---|---|
| 정형 데이터 | 일정한 형식으로 정리된 데이터 | 표, 엑셀 파일, 데이터베이스 |
| 비정형 데이터 | 정해진 형식이 없는 데이터 | 이미지, 음성, 영상, 텍스트 |
예를 들어 학생 정보를 담은 표는 정형 데이터에 해당한다. 반면 사진, 동영상, 음성 파일, 뉴스 기사와 같은 자료는 비정형 데이터에 해당한다.
인공지능은 이런 다양한 데이터를 학습하여 문제를 해결한다.
2) 알고리즘
알고리즘은 문제를 해결하기 위한 절차나 규칙이다.
인공지능에서 알고리즘은 데이터를 어떻게 학습하고, 어떤 방식으로 판단할지를 결정하는 역할을 한다.
예를 들어 스팸 메일을 분류하는 과정을 단순화하면 다음과 같다.
[메일 데이터 입력]
↓
[메일의 특징 분석]
↓
[스팸 여부 판단 기준 학습]
↓
[새로운 메일의 스팸 여부 예측]
머신러닝에서는 학습 방식에 따라 다양한 알고리즘이 사용된다. 대표적인 학습 방식에는 지도학습, 비지도학습, 강화학습이 있다.
지도학습(Supervised Learning)
레이블(Label)이 포함된 데이터를 사용하여 모델을 훈련시키는 방법
모델은 입력과 출력 간의 관계를 학습하여, 새로운 입력이 주어졌을 때 정확한 출력을 예측할 수 있도록 훈련된다. 지도학습의 대표적인 알고리즘으로는 다음과 같은 것들이 있다.
- 회귀(Regression): 연속적인 값을 예측하는 데 사용된다. 예를 들어 집의 크기, 방의 개수, 위치 등의 정보를 바탕으로 집의 가격을 예측하는 것이 회귀 문제에 해당한다.
집값 ^
| * *
| * / *
| */ 예측선(/)
| / *
+-----------> 면적
입력: 면적, 방 개수, 위치, ... → 출력: 집값(숫자)-
분류(Classification): 입력 데이터를 미리 정의된 클래스(Class) 중 하나로 분류하는 작업이다. 이메일의 스팸 여부를 판단하거나, 사진 속 동물이 고양이인지 강아지인지 구분하는 것이 분류 문제의 예이다.
-
의사결정 트리(Decision Tree): 데이터를 여러 질문(기준)으로 단계별로 나누며 분류하는 알고리즘이다.
[발신자 모르는 사람?]
/ \
Yes No
| |
["무료","당첨" 포함?] 정상 ✉
/ \
Yes No
| |
스팸 🚫 정상 ✉- 랜덤 포레스트(Random Forest): 여러 개의 의사결정 트리를 결합하여 예측 성능을 향상시키는 알고리즘이다.
데이터
/ | \
트리1 트리2 트리3
| | |
스팸 정상 스팸
\ | /
[다수결: 스팸 2 vs 정상 1]
|
스팸 🚫- 서포트 벡터 머신(Support Vector Machine, SVM): 두 그룹을 가장 효과적으로 구분할 수 있는 결정경계를 설정하여 데이터를 분류하는 알고리즘이다.
O O | X X
O O | X X
O | X
[결정경계]
←마진→ | ←마진→
O = 정상 메일 X = 스팸 메일- k-최근접 이웃(k-Nearest Neighbors): 새로운 데이터가 주어지면, 가장 가까운 k개의 이웃 데이터를 참고하여 분류하는 방법이다.
O X
O ↑
O ★ X ★ = 새 메일
O ↓ k=3: 이웃 O O O
O X
→ 정상 메일로 분류 ✉비지도학습(Unsupervised Learning)
레이블이 없는 데이터, 즉 정답이 제공되지 않은 데이터를 활용하여 모델을 학습시키는 방법
비지도학습에서 패턴을 발견한다는 것은 데이터의 구조를 파악하고, 특징이 유사한 데이터를 그룹화하는 것을 의미한다. 대표적인 알고리즘은 다음과 같다.
- 클러스터링(Clustering): 데이터의 유사한 특성을 기반으로 그룹을 형성하는 기법이다. 예를 들어 K-평균 클러스터링(K-Means Clustering)은 데이터의 유사한 특징을 기준으로 K개의 그룹으로 나누는 방법이고, 밀도 기반 클러스터링(DBSCAN)은 가까이 모여 있는 데이터를 하나의 그룹으로 묶는 방법이다.
[학습 전] [학습 후]
* * * * A A A A ← 그룹 A (VIP)
* * * * B B B ← 그룹 B (일반)
* * * C C C ← 그룹 C (잠재)
레이블 없음 → 유사한 것끼리 자동 그룹화- 차원 축소(Dimensionality Reduction): 복잡한 데이터에서 핵심 정보만 추출하여 더 간결한 형태로 변환하는 기법이다. 주성분 분석(PCA)이 대표적인 예로, 많은 양의 복잡한 데이터에서 핵심 정보를 추출하는 방법이다.
[2차원 원본] [1차원으로 축소]
y ^
| * *
| * * * → * * * * * * -->
| * *
+---------> x
특징 수십 개 → 핵심 성분 몇 개로 압축강화학습(Reinforcement Learning)
에이전트가 스스로 행동하면서 보상을 최대화하는 방법을 배우는 학습 방식
강화학습의 작동 방식은 게임의 형태와 비슷하다. 에이전트(게임 캐릭터)가 환경(게임 세계) 안에서 행동을 선택하고, 그 결과로 보상을 받는다. 에이전트는 받은 보상을 바탕으로 자신의 정책을 지속적으로 업데이트하며, 에이전트와 환경이 끊임없이 상호작용하며 정책을 개선하는 반복적인 과정이 강화학습의 본질이다.
강화학습은 주로 게임, 로봇 제어, 자율주행 자동차 등 실시간 의사결정이 필요한 분야에서 널리 활용된다. 대표적인 알고리즘으로는 Q-러닝, 딥 Q-네트워크(DQN), A3C, PPO 등이 있다.
아래 표는 세 가지 학습 방식을 정리한 것이다.
| 구분 | 지도학습 | 비지도학습 | 강화학습 |
|---|---|---|---|
| 정의 | 레이블링된 데이터를 사용하여 학습한다 | 레이블이 없는 데이터를 사용하여 학습한다 | 에이전트가 환경과 상호작용하며 보상을 최대화하는 행동을 학습한다 |
| 목적 | 입력과 출력 간의 관계를 학습하여 새로운 입력을 예측 | 데이터의 패턴이나 구조를 발견하여 그룹화 | 최적의 행동 전략을 학습하여 의사결정을 최적화 |
| 주요 알고리즘 | 선형 회귀, 로지스틱 회귀, 의사결정 트리, 랜덤 포레스트, SVM, k-최근접 이웃 등 | K-평균 클러스터링, 밀도 기반 클러스터링, 주성분 분석 등 | Q-러닝, 딥 Q-네트워크(DQN), A3C, PPO 등 |
3) 컴퓨팅 자원
아무리 좋은 데이터와 알고리즘이 있어도, 이를 실제로 처리할 컴퓨팅 자원이 없으면 인공지능 모델을 만들 수 없다.
특히 GPU(Graphic Processing Unit) 는 그래픽 처리 장치로, 본래 컴퓨터 그래픽을 처리하는 하드웨어이다. 그런데 대규모 병렬 연산을 수행할 수 있는 특성 덕분에 딥러닝과 같은 인공지능 학습에도 널리 활용되고 있다. 수많은 연산을 동시에 처리할 수 있다는 점에서, 복잡한 인공신경망을 훈련하는 데 CPU보다 훨씬 효율적이다.
4) 모델
인공지능의 마지막 구성 요소인 모델(Model) 은 주어진 데이터에서 패턴을 학습하고, 이를 바탕으로 예측하거나 결정을 내릴 수 있는 컴퓨터 프로그램이다.
모델이 만들어지는 과정을 이미지 분류 예시로 살펴보면 다음과 같다.
① 데이터 수집 및 준비
수천 장의 고양이와 강아지 이미지를 수집하고, 각 이미지에 레이블(고양이/강아지)을 붙인다.
↓
② 알고리즘 선택
합성곱 신경망(CNN) 알고리즘을 선택한다.
↓
③ 모델 학습
이미지 데이터를 모델에 입력하여 학습시킨다.
모델은 각 이미지의 특징을 학습하고, 고양이와 강아지를 구분하는 패턴을 찾아낸다.
↓
④ 모델 평가
학습에 사용하지 않은 이미지를 사용하여 모델의 성능을 평가한다.
모델이 새로운 이미지를 얼마나 정확하게 분류하는지 확인한다.
이렇게 완성된 모델은 새로운 이미지가 들어왔을 때 고양이인지 강아지인지 스스로 판단할 수 있게 된다.
참고) 합성곱 신경망(Convolutional Neural Network, CNN)은 이미지 인식 및 처리에 특화된 딥러닝 모델의 한 유형이다.
이번 글에서는 인공지능의 기본 개념부터 머신러닝·딥러닝의 차이, 그리고 인공지능을 구성하는 핵심 요소들을 살펴봤다.
정리하자면, 인공지능은 인간의 지능적 활동을 컴퓨터로 구현하려는 기술 분야이고, 머신러닝은 그 구현 방법 중 하나이며, 딥러닝은 다시 머신러닝의 한 분야다. 그리고 이 모든 것이 제대로 작동하려면 좋은 데이터, 적절한 알고리즘, 충분한 컴퓨팅 자원, 그리고 잘 훈련된 모델이 함께 갖춰져야 한다.
댓글
댓글을 불러오는 중...