기본

Neural Network

뉴럴 네트워크

AI 기초 분야에서 쓰이는 용어로, 사람 뇌의 뉴런이 신호를 주고받는 구조에서 착안해 입력값을 여러 층의 노드를 거쳐 변환·예측하도록 만든 인공지능 핵심 모델 구조입니다.

쉬운 풀이

신경망은 입력값에 가중치를 곱하고 더한 뒤, 활성화 함수라는 비선형 변환을 거쳐 다음 층으로 신호를 넘기는 작업을 여러 층 쌓아 올린 구조예요. 시험 과목별 점수에 각자 다른 비중을 매겨 학점을 산출하는 평가표가 한 층짜리 신경망이라면, 그 학점을 다시 조별 점수·출석·발표 비중과 섞어 최종 등급을 내는 과정이 두 층짜리 신경망에 가깝습니다. 요즘 쓰는 ChatGPT·Claude·Gemini가 모두 이 구조를 거대화한 모델이라, 신경망을 한 줄로 이해해 두면 AI 관련 기사를 읽을 때 훨씬 편해요.

한 줄 비유

견적 항목마다 가중치를 매겨 최종 단가를 산출하는 다단계 결재 구조입니다.

활용 예시

Case 1

AlexNet — 2012년 ImageNet 패턴 인식 판도 전환

2012년 9월 토론토대 Alex Krizhevsky, Ilya Sutskever, Geoffrey Hinton 팀이 합성곱 신경망(CNN) AlexNet으로 ImageNet 대회에 출전해 Top-5 오류율 15.3%를 기록했습니다.^[6] 이는 직전 해 최고 기록인 26.2%를 10.9%p 앞선 결과로, 컴퓨터 비전 전 업계가 신경망 기반으로 전환하는 출발점이 됐습니다.^[6] NVIDIA GTX 580 GPU 2장으로 학습했으며, 이 결과 이후 사내 품질 검수·의료 영상 판독 도구의 상용화 시점이 갈렸습니다.

Case 2

네이버 HyperCLOVA X — 한국어 대형 신경망 모델

네이버클라우드 공식 보도자료에 따르면 HyperCLOVA X는 트랜스포머 디코더 기반 신경망으로 만든 한국어 특화 거대 언어 모델(LLM)이며, 2025년 추론 기능을 강화한 신규 모델을 정식 출시했습니다.^[7] 한국어 자연어 처리에 특화된 토크나이저와 사람 피드백 강화학습(RLHF) 단계를 결합해 사내 보고서 초안·정부 문서 응답·검색 답변 생성에 투입되고 있습니다.^[7] 한국 기업이 자체 운영하는 신경망 모델이 외산 모델과 별도 트랙으로 운영되는 대표 사례입니다.

Case 3

OpenAI ChatGPT — 트랜스포머 신경망의 대중화

2017년 구글이 발표한 트랜스포머 신경망 구조는 셀프 어텐션으로 문장 안 단어 간 관계를 한 번에 계산하는 방식이며, OpenAI는 이 디코더 부분만 떼어 GPT 시리즈를 만들었습니다.^[8] 2022년 11월 공개한 ChatGPT는 출시 2개월 만에 월간 활성 사용자 1억 명을 돌파해 역대 인터넷 서비스 최단 기록을 세웠습니다.^[11] 회의록 요약·코드 초안·메일 답신 같은 일상 업무가 모두 동일한 신경망 구조 위에서 처리됩니다.

Case 4

DeepMind AlphaFold — 단백질 구조 예측과 2024 노벨 화학상

2020년 DeepMind의 AlphaFold는 트랜스포머 기반 신경망으로 아미노산 서열로부터 단백질 3차원 구조를 예측하는 50년 묵은 난제를 해결했고, Demis Hassabis와 John Jumper는 2024년 노벨 화학상을 수상했습니다.^[9] 공개된 단백질 구조는 2억 개 이상이며 전 세계 200만 명 넘는 연구자가 사용하고 있습니다.^[9] 신약 후보 발굴 기간이 수년 단위에서 수개월 단위로 단축된 출발점입니다.

참고사항

Nature 1986년 논문(323권 533쪽) 초록 한 단락만 캡처해 사내 자료 폴더에 보관합니다.
IBM 'What Is a Neural Network?' 공식 페이지를 열어 입력층·은닉층·출력층 도식을 한 장으로 정리합니다.
노벨위원회 공식 발표문(2024 물리학상)에서 Hopfield·Hinton 수상 사유 한 문장을 인용 가능한 형태로 메모합니다.
사내에서 쓰는 ChatGPT·Claude·Gemini가 모두 신경망 기반임을 확인하고, 해당 모델 카드(공식 문서)의 파라미터 수와 학습 데이터 규모를 표로 정리합니다.
다음 회의에서 '신경망은 1986년 backpropagation 논문, 2012년 AlexNet, 2017년 트랜스포머로 표준화되었습니다'라는 한 문장으로 보고합니다.

신경망의 가장 큰 한계는 학습 비용과 해석 가능성입니다. 대형 모델은 수십억~수조 단위의 가중치를 갖고, 학습에 수천 장의 GPU와 수개월이 들어갑니다.^[2] 또한 내부 가중치가 어떤 의미를 갖는지 직접 해석하기 어렵기 때문에 '왜 이런 답을 냈는가'를 사후 설명하기 까다롭고, 이 문제를 다루는 해석 가능성(interpretability) 연구가 별도 분야로 자리잡았습니다.^[2] 학습 데이터에 포함된 편향이 결과에 그대로 반영되는 문제, 분포 밖 입력에서 발생하는 환각(hallucination), 보안·프라이버시 측면의 가중치 추출 공격도 공식 출처에서 반복 지적되는 한계입니다.^[1] 1969년 Minsky와 Papert가 단층 퍼셉트론의 표현력 한계를 지적해 이른바 'AI 겨울'을 부른 사건처럼, 한계 자체가 다음 세대 구조를 끌어낸 흐름이 신경망 역사의 큰 줄기입니다.^[4]

진화 방향은 크게 세 갈래입니다.

구조의 확장으로 1986년 다층 퍼셉트론에서 2012년 합성곱 신경망(CNN), 2017년 트랜스포머, 2024년 멀티모달·추론 모델까지 매 시기 새로운 아키텍처가 표준을 갱신해 왔습니다.^[6][8]
학문적 정당성의 확보로 2024년 노벨 물리학상이 신경망 기초 연구에 수여되면서 학계 정설로 자리잡았습니다.^[5]
응용 도메인의 확장으로 AlphaFold가 받은 2024년 노벨 화학상은 신경망이 자연과학 연구 도구로 인정받은 사례이며, 의료 영상·금융 사기 탐지·로봇 제어까지 동일한 신경망 골격이 적용되고 있습니다.^[9] 현재 시점에서는 이 구조를 대체할 후보가 뚜렷하지 않은 상황입니다.

이 용어와의 관계

유사 개념
Throughput같은 기본 갈래에서 자주 함께 등장하는 개념입니다.
유사 개념
Latency같은 기본 갈래에서 자주 함께 등장하는 개념입니다.
유사 개념
SWE-bench같은 기본 갈래에서 자주 함께 등장하는 개념입니다.