Neural Network
뉴럴 네트워크
AI 기초 분야에서 쓰이는 용어로, 사람 뇌의 뉴런이 신호를 주고받는 구조에서 착안해 입력값을 여러 층의 노드를 거쳐 변환·예측하도록 만든 인공지능 핵심 모델 구조입니다.
신경망은 입력값에 가중치를 곱하고 더한 뒤, 활성화 함수라는 비선형 변환을 거쳐 다음 층으로 신호를 넘기는 작업을 여러 층 쌓아 올린 구조예요. 시험 과목별 점수에 각자 다른 비중을 매겨 학점을 산출하는 평가표가 한 층짜리 신경망이라면, 그 학점을 다시 조별 점수·출석·발표 비중과 섞어 최종 등급을 내는 과정이 두 층짜리 신경망에 가깝습니다. 요즘 쓰는 ChatGPT·Claude·Gemini가 모두 이 구조를 거대화한 모델이라, 신경망을 한 줄로 이해해 두면 AI 관련 기사를 읽을 때 훨씬 편해요.
견적 항목마다 가중치를 매겨 최종 단가를 산출하는 다단계 결재 구조입니다.
AlexNet — 2012년 ImageNet 패턴 인식 판도 전환
2012년 9월 토론토대 Alex Krizhevsky, Ilya Sutskever, Geoffrey Hinton 팀이 합성곱 신경망(CNN) AlexNet으로 ImageNet 대회에 출전해 Top-5 오류율 15.3%를 기록했습니다.[6] 이는 직전 해 최고 기록인 26.2%를 10.9%p 앞선 결과로, 컴퓨터 비전 전 업계가 신경망 기반으로 전환하는 출발점이 됐습니다.[6] NVIDIA GTX 580 GPU 2장으로 학습했으며, 이 결과 이후 사내 품질 검수·의료 영상 판독 도구의 상용화 시점이 갈렸습니다.
네이버 HyperCLOVA X — 한국어 대형 신경망 모델
네이버클라우드 공식 보도자료에 따르면 HyperCLOVA X는 트랜스포머 디코더 기반 신경망으로 만든 한국어 특화 거대 언어 모델(LLM)이며, 2025년 추론 기능을 강화한 신규 모델을 정식 출시했습니다.[7] 한국어 자연어 처리에 특화된 토크나이저와 사람 피드백 강화학습(RLHF) 단계를 결합해 사내 보고서 초안·정부 문서 응답·검색 답변 생성에 투입되고 있습니다.[7] 한국 기업이 자체 운영하는 신경망 모델이 외산 모델과 별도 트랙으로 운영되는 대표 사례입니다.
OpenAI ChatGPT — 트랜스포머 신경망의 대중화
2017년 구글이 발표한 트랜스포머 신경망 구조는 셀프 어텐션으로 문장 안 단어 간 관계를 한 번에 계산하는 방식이며, OpenAI는 이 디코더 부분만 떼어 GPT 시리즈를 만들었습니다.[8] 2022년 11월 공개한 ChatGPT는 출시 2개월 만에 월간 활성 사용자 1억 명을 돌파해 역대 인터넷 서비스 최단 기록을 세웠습니다.[11] 회의록 요약·코드 초안·메일 답신 같은 일상 업무가 모두 동일한 신경망 구조 위에서 처리됩니다.
DeepMind AlphaFold — 단백질 구조 예측과 2024 노벨 화학상
2020년 DeepMind의 AlphaFold는 트랜스포머 기반 신경망으로 아미노산 서열로부터 단백질 3차원 구조를 예측하는 50년 묵은 난제를 해결했고, Demis Hassabis와 John Jumper는 2024년 노벨 화학상을 수상했습니다.[9] 공개된 단백질 구조는 2억 개 이상이며 전 세계 200만 명 넘는 연구자가 사용하고 있습니다.[9] 신약 후보 발굴 기간이 수년 단위에서 수개월 단위로 단축된 출발점입니다.
- Nature 1986년 논문(323권 533쪽) 초록 한 단락만 캡처해 사내 자료 폴더에 보관합니다.
- IBM 'What Is a Neural Network?' 공식 페이지를 열어 입력층·은닉층·출력층 도식을 한 장으로 정리합니다.
- 노벨위원회 공식 발표문(2024 물리학상)에서 Hopfield·Hinton 수상 사유 한 문장을 인용 가능한 형태로 메모합니다.
- 사내에서 쓰는 ChatGPT·Claude·Gemini가 모두 신경망 기반임을 확인하고, 해당 모델 카드(공식 문서)의 파라미터 수와 학습 데이터 규모를 표로 정리합니다.
- 다음 회의에서 '신경망은 1986년 backpropagation 논문, 2012년 AlexNet, 2017년 트랜스포머로 표준화되었습니다'라는 한 문장으로 보고합니다.
신경망의 가장 큰 한계는 학습 비용과 해석 가능성입니다. 대형 모델은 수십억~수조 단위의 가중치를 갖고, 학습에 수천 장의 GPU와 수개월이 들어갑니다.[2] 또한 내부 가중치가 어떤 의미를 갖는지 직접 해석하기 어렵기 때문에 '왜 이런 답을 냈는가'를 사후 설명하기 까다롭고, 이 문제를 다루는 해석 가능성(interpretability) 연구가 별도 분야로 자리잡았습니다.[2] 학습 데이터에 포함된 편향이 결과에 그대로 반영되는 문제, 분포 밖 입력에서 발생하는 환각(hallucination), 보안·프라이버시 측면의 가중치 추출 공격도 공식 출처에서 반복 지적되는 한계입니다.[1] 1969년 Minsky와 Papert가 단층 퍼셉트론의 표현력 한계를 지적해 이른바 'AI 겨울'을 부른 사건처럼, 한계 자체가 다음 세대 구조를 끌어낸 흐름이 신경망 역사의 큰 줄기입니다.[4]
진화 방향은 크게 세 갈래입니다.
- 구조의 확장으로 1986년 다층 퍼셉트론에서 2012년 합성곱 신경망(CNN), 2017년 트랜스포머, 2024년 멀티모달·추론 모델까지 매 시기 새로운 아키텍처가 표준을 갱신해 왔습니다.[6][8]
- 학문적 정당성의 확보로 2024년 노벨 물리학상이 신경망 기초 연구에 수여되면서 학계 정설로 자리잡았습니다.[5]
- 응용 도메인의 확장으로 AlphaFold가 받은 2024년 노벨 화학상은 신경망이 자연과학 연구 도구로 인정받은 사례이며, 의료 영상·금융 사기 탐지·로봇 제어까지 동일한 신경망 골격이 적용되고 있습니다.[9] 현재 시점에서는 이 구조를 대체할 후보가 뚜렷하지 않은 상황입니다.
- 유사 개념Throughput같은 기본 갈래에서 자주 함께 등장하는 개념입니다.
- 유사 개념Latency같은 기본 갈래에서 자주 함께 등장하는 개념입니다.
- 유사 개념SWE-bench같은 기본 갈래에서 자주 함께 등장하는 개념입니다.
- Learning representations by back-propagating errors — 학술 논문 · Nature 323권 (Rumelhart, Hinton, Williams) · 1986년 10월
- What Is a Neural Network? — 공식 기술 문서 · IBM Think · 2024년 기준
- McCulloch & Pitts: First Mathematical Model of a Neural Network — 사료 정리 · History of Information · 1943년 원전 기록
- Birthplace of Neural Networks: McCulloch & Pitts at UChicago — 대학 공식 · University of Chicago · 신경망 역사 정리
- The Nobel Prize in Physics 2024 — Press release — 1차 출처 · 노벨위원회 공식 · 2024년 10월
- AlexNet — ImageNet Classification with Deep CNNs — 학회 논문 · NeurIPS 2012 (Krizhevsky, Sutskever, Hinton)
- 네이버, HyperCLOVA X 신규 추론 모델 정식 출시 — 1차 출처 · 네이버클라우드 공식 보도자료
- Attention Is All You Need — 학술 논문 · arXiv (Vaswani et al.) · 2017년 6월
- Nobel Prize in Chemistry 2024 — Popular information — 1차 출처 · 노벨위원회 공식 · AlphaFold/DeepMind · 2024년 10월
- CS230 Deep Learning — Stanford — 대학 공식 · Stanford (Andrew Ng) · 강의 자료
이 페이지가 도움이 되었나요?
제안·수정 요청은 meet@percent.ac 로 보내주시면 다음 갱신에 반영합니다.