* 본 포스팅은 패스트캠퍼스의 "AI 시대, PM/PO 를 위한 한 번에 끝내는 AI 서비스 기획 실무" 강의를 듣고 요약한 내용입니다.
온라인 강의를 수강한 후 개인적으로 정리한 내용입니다.
🤖 인공지능이란?
인공지능 = 데이터 = 숫자정보(벡터화) 분류
- 데이터 분류기, 패턴을 예측하는 것
- 수학적 분석에 기반한 결과을 도출하는 것(기계는 사람처럼 직관이 없으므로)
- 판단 기준이 되는 데이터가 매우 중요‼️
(충분한 학습 데이터 필요. 어떠한 결과를 얻을지 방향성을 사람이 잡고나서 딥러닝을 돌려야 함)- 사람이 보았을 때도 차이가 분명하게 구분 되는 것이 좋은 데이터
- 데이터가 좋지 못하면, 절대 좋은 결과를 얻을 수 없음.
🆚 세대별 인공지능 비교
1세대: 튜링머신 | 2세대: 머신러닝 | 3세대: 딥러닝 |
규칙 기반 시스템. 짧은 시간 내 암호해독, 정보탐색, 추론 정보 탐색, 추론 |
인간의 뇌구조 모방, 자주 사용되는 정보 연결을 강화하여 학습 정보 연결 강화/분류 |
데이터를 통해서 기계 스스로 정보연결 구조 개선, 특징 도출 및 판단 특징 도출 및 판단 |
😃 좋은 데이터의 기준
- 분명한 특징: 차이가 분명하게 구분되는 데이터가 좋음. 특징값이 크고 패턴화가 잘 되어 있어야 AI가 학습하기 용이
- 충분한 양: AI 모델 학습에는 충분한 양의 데이터가 필요. 데이터가 부족하면 AI 모델이 제대로 학습되지 않아 정확도가 떨어질 수 있음
- 균형: 학습 데이터와 검증 데이터의 숫자가 균일해야 함. 특정 데이터가 많으면 AI 모델이 편향될 수 있음.
- 일관성: 데이터의 품질이 일관되어야 함. 오류가 있거나 불규칙적인 데이터는 AI 모델의 성능을 저하시킬 수 있음.
- 정확성: 데이터는 정확해야 함. 잘못된 데이터는 AI 모델을 잘못된 방향으로 학습시킬 수 있음.
AI는 데이터를 기반으로 학습하고 작동하기 때문에, AI 서비스 기획자는 데이터에 대한 이해가 필수적이다.
데이터의 종류, 품질, 양 등 다양한 요소가 AI 모델의 성능에 영향을 미치므로, AI 서비스 기획자는 이러한 요소들을 고려하여 데이터를 수집하고 관리해야 함.
🔢 데이터 벡터화(숫자화)
- 인간이 상상하고 표현할 수 있는 것은 모두 “글”로 표현 가능
- 벡터화(숫자화) 기준도 문자를 최우선 처리 (영상처리 등은 예외케이스)
- 문자는 데이터 처리 효율이 가장 높음. AI 데이터 구축에 가장 널리 활용됨.
- 문자 데이터 학습 후 → 사진 데이터 학습
- 핵심: 문자와 사진의 연관 관계 파악
- 문자에 대응하는 사진의 시각적 특징을 추출
- 사진의 모든 부분을 다 학습하면, 컴퓨터 자원도 많이 소모되고 비용 큼
- 따라서 중요한 특징을 뽑아서 분류하고 분석해야 함.
- ex. 출입 시 얼굴인식: 특징값만 뽑아서 벡터화 시키는 것. 사진 자체를 저장x[
[학습 비용]
문자 < 사진 < 동영상
- 동영상 학습 비용이 높은 이유: 영상을 프레임 단위로 구분하여 1초 단위로 사진으로 변환해야 함.
- 특수한 경우를 제외하면 가급적 영상과 관련된 사진을 사용
- 특수한 경우: 지능형 CCTV
💻 AI 정보와 데이터 센터
AI 정보는 모두 데이터 센터에 저장되므로 AI 기획자도 기술 이해가 필요
방대한 AI 데이터 처리를 위해 4개의 파트(CPU, GPU, 네트워크 반도체, Network)가 유기적으로 연결되어 있는 하드웨어 구조를 사용.
- CPU (Central Processing Unit - 중앙처리장치): 데이터베이스 처리에 강점이 있어 AI 센터에서 사용
- GPU (Graphic Processing Unit - 그래픽처리장치): 많은 데이터 계산을 동시에 처리할 수 있기 때문에 AI 센터의 핵심
- 네트워크 반도체 (FPGA - Field Programmable Gate Array): 회로 변경이 가능한 반도체로, AI 센터의 네트워크 상황에 따라 특화하여 사용. 즉, 유연하게 네트워크를 구성할 수 있도록 도와줌
- Network: 외부 네트워크는 사용자의 질문을 받고 답변을 출력하는 역할을, 내부 네트워크는 방대한 저장 데이터를 관리하고 추가 정보를 제공하는 역할
AI 서비스 데이터 처리 과정:
- Network: 수백 Gbps 속도로 데이터를 입력/출력
- 네트워크 반도체 (FPGA): 네트워크 병목 현상을 제어
- CPU: 데이터베이스 처리 및 데이터 작업을 배분
- GPU: 초고속 데이터 병렬 계산을 수행 (가장 중요한 과정).
이 과정에서 많은 비용이 발생한다.
하지만 실제 내가 기획하는 서비스에서 이정도 비용을 감당하기는 어려울 것 → 분야가 제한된 ANI(Artificial Narrow Intelligence)
😎 인공지능 유형
구분 | ANI (Artificial Narrow Intelligence) | AGI (Artificial General Intelligence) | ASI (Artificial Super Intelligence) |
정의 | 특정 하나의 분야에 특화된 AI | 다양한 분야에서 제한 없이 사용 가능한 AI | 모든 분야에서 사람의 지적 능력을 초월하는 AI |
특징 | - 제한된 영역에서만 작동 - 단일 목적 수행에 최적화 |
- 범용적인 문제 해결 능력 - 인간과 유사한 사고방식 |
- 자의식, 감정, 창의력 등 인간 수준의 지능 - 인간의 이해를 뛰어넘는 능력 |
현재수준 | 일상생활에서 널리 사용됨 | 연구 개발 진행 중 | 개념적 단계, 아직 실현되지 않음 |
예시 | - 이미지 인식 음성 인식 - 기계 번역 - 스팸 필터링 - 추천 시스템 |
- Chat GPT - Microsoft Copilot |
- 영화 속 AI (ex. Her, Transcendence) |
기타 | - 대부분의 AI 서비스가 ANI에 속함 - AGI 발전에 윤리적 문제 고려 필요 |
AGI는 ASI의 전 단계 | ASI는 아직 가상의 개념 |
반응형
'AI 서비스 기획' 카테고리의 다른 글
AI 신경망 기술: 8가지 핵심 모델 (0) | 2024.12.25 |
---|