AI 신경망 기술: 8가지 핵심 모델

AI 서비스 기획

AI 신경망 기술: 8가지 핵심 모델

pm-ing 2024. 12. 25. 21:23

1. DNN (Deep Neural Network, 심층 신경망) 모델

이미지 출처: https://www.researchgate.net/figure/A-multi-layer-neural-network-with-n-inputs-at-least-two-hidden-layers-and-one-output_fig5_330230427

여러 개의 은닉층을 가지는 인공 신경망 모델이다.
역전파 알고리즘을 통해 학습하며, 입력 데이터가 네트워크를 통과하면서 가중치가 조정되어 목표 출력과의 오차를 최소화한다.
복잡한 비선형 문제를 해결할 수 있으며, 이미지, 음성, 텍스트 등 다양한 분야에 적용 가능하다.
컴퓨터 비전, 자연어 처리, 음성 인식, 로봇 제어 등 광범위한 분야에서 활용된다.
장점: 높은 성능, 다양한 분야에 적용 가능
단점: 많은 데이터와 계산 자원 필요,

2. CNN (Convolutional Neural Network, 합성곱 신경망) 모델

CNN의 구조

이미지 출처: https://www.researchgate.net/figure/The-structure-of-a-CNN-consisting-of-convolutional-pooling-and-fully-connected-layers_fig1_317934321

이미지 처리에 특화된 DNN 모델이다.
주요 구성 요소로 합성곱 층, 풀링 층, 완전 연결 층이 존재한다.
풀링 층은 특정 맵의 크기를 줄이고 주요 특징을 보존한다.
합성곱 연산을 통해 이미지의 지역적 특징을 추출한다.
이미지 분류, 객체 탐지, 세그멘테이션 등 컴퓨터 비전 분야에서 널리 사용된다.
최근에는 의료 영상 분석, 자율 주행 등으로 응용 범위가 확대되고 있다.
장점: 이미지 처리에 높은 성능, 특징 추출 및 학습 용이
단점: 데이터 의존성 높음, 계산량 많음

3. RNN (Recurrent Neural Network, 순환 신경망) 모델

이미지 출처: https://www.analyticsvidhya.com/blog/2022/03/a-brief-overview-of-recurrent-neural-networks-rnn/

시퀀스 데이터 처리에 특화된 DNN 모델이다.
이전 출력이 현재 입력에 영향을 미치는 순환 구조를 가진다.
자연어 처리, 음성 인식, 시계열 데이터 분석 등에 활용된다.
장점: 시퀀스 데이터 처리에 효과적, 시간적 정보 학습 가능
단점: 장기 의존성 문제, 기울기 소실/폭발 문제

4. LSTM (Long Short-Term Memory, 장단기 메모리) 모델

이미지 출처: https://www.researchgate.net/figure/An-LSTM-cell-structure-showing-the-Input-Forget-and-Output-gates_fig2_344554659

RNN의 한계를 극복한 모델로, 장기 의존성 문제를 해결하기 위해 순환 처리하는 정보의 양을 조절한다.
입력 게이트, 망각 게이트, 출력 게이트를 통해 정보의 흐름을 제어하여 장기 기억을 유지한다.
텍스트 생성, 기계 번역, 감성 분석, 음성 인식, 주가 예측 등 다양한 시퀀스 데이터 처리 분야에서 활용된다.
긴 시퀀스 데이터에서 우수한 성능을 보인다.
장점: RNN의 장기 의존성 문제 해결, 긴 시퀀스 데이터 학습 가능
단점: 복잡한 구조, 계산량 많음

5. GAN (Generative Adversarial Network, 적대적 생성 신경망) 모델

이미지 출처: https://www.researchgate.net/figure/llustration-of-GAN-In-GAN-we-have-a-pair-of-networks-competing-with-each-other-at-the_fig5_331435145

생성자와 판별자 두 개의 신경망으로 구성된다.
생성자는 가짜 데이터를 생성하고, 판별자는 가짜 데이터와 진짜 데이터를 구분하면서 학습한다.
양쪽의 극단적인 데이터를 생성할 수 있다.
비용이 매우 높다는 단점이 있다.
장점: 새로운 데이터 생성 가능, 다양한 분야에 활용 가능
단점: 학습 불안정, 모드 붕괴 문제, 평가 어려움

6. Transformer (트랜스포머) 모델

이미지 출처: https://medium.com/machine-intelligence-and-deep-learning-lab/transformer-the-self-attention-mechanism-d7d853c2c621

최신 Transformer 모델은 Self-Attention 기술을 사용한다.
Attention 기술은 입력 시퀀스의 각 부분에 대한 가중치를 계산하여, 특정 부분에 더 집중할 수 있도록 한다.
인코더-디코더 구조를 가지며, 인코더는 입력 시퀀스를 벡터화하고, 디코더는 인코더의 출력을 바탕으로 목표 시퀀스를 생성한다.
복잡한 시퀀스 변환 작업을 효과적으로 수행할 수 있도록 한다.
장점: 병렬 처리 가능, 긴 시퀀스 처리에 효과적, 다양한 task에 높은 성능
단점: 높은 계산 복잡도, 데이터 의존성 높음

7. RAG (Retrieval-Augmented Generation, 검색 증강 생성) 모델

이미지 출처: https://qdrant.tech/articles/what-is-rag-in-ai/

응답을 생성하기 전, 신뢰할 수 있는 지식을 먼저 검색하여 결과를 개선하는 기술이다.
지식베이스 검색 기능을 통해 대화 내용에 맞는 관련 정보를 검색하고 활용한다.
Wikipedia, Wikidata 등의 대규모 지식베이스와 통합하여 다양한 주제에 대한 정보를 활용할 수 있도록 한다.
Transformer 기반의 인코더 디코더 구조를 사용한다.
대화 맥락을 이해하고 관련 정보를 검색하여 적절한 응답을 생성한다.
장점: 정확하고 신뢰성 있는 정보 제공, 최신 정보 반영 가능, 대화 맥락 이해
단점: 지식베이스 구축 및 관리 필요, 검색 효율성 중요

8. RLHF (Reinforcement Learning from Human Feedback, 인간 피드백 강화 학습) 모델

이미지 출처: https://huggingface.co/blog/rlhf

대규모 언어 모델과 지식 그래프에서 어떤 정보가 최우선되어야 하는지 모호한 문제를 해결하기 위해 인간의 피드백을 활용하는 학습 단계를 추가한다.
인간의 피드백 값이 Reward Model 결과에 추가되어 더 현실적인 출력을 생성한다.
장점: 인간의 선호도 반영, 모델 출력 품질 향상, 다양한 task에 적용 가능
단점: 인간 피드백 수집 비용, 피드백의 주관성, 보상 모델 설계 어려움

저작자표시 비영리 변경금지

'AI 서비스 기획' 카테고리의 다른 글

AI 서비스 기획을 위한, 인공지능 이해하기 (4)	2024.12.26

현재글AI 신경망 기술: 8가지 핵심 모델

시니어 PM이 되어가는 과정

현명한 올라운더 PM으로 성장하기 위해 많은 인사이트를 담아갈 블로그입니다.

티스토리툴바