728x90 Artificial Intelligence28 Learning Self-Attention with Neural Networks 트랜스포머와 같은 신경망에서 이것이 어떻게 작동하는지 구체적으로 알아보겠습니다.Encode position information언어 예제로 돌아가 보자면, 우리의 목표는 이 입력 문장에서 의미론적으로 중요한 특징들을 식별하고 주목하는 것이다.첫 번째 단계는 시퀀스를 갖는 것이다. 우리는 순서를 갖고 있다. 반복을 제거했으며, 모든 시간 단계를 한 번에 입력하고 있다. 여전히 순서와 위치 의존성에 대한 정보를 인코딩하고 캡처할 방법이 필요하다. 이것이 수행되는 방식은 위치 인코딩(positional encoding)이라는 아이디어를 통해 순서 정보를 포함시키는 것이다. 이는 시퀀스에 내재된 순서 정보를 캡처한다. 간단히 설명하자면, 이 아이디어는 이전에 소개한 *임베딩(embedding)과 관련이 있다. .. 2024. 7. 11. Attention Is All You Need 주의(attention)는 트랜스포머(Transformer) 아키텍처의 기초 메커니즘으로, 많은 분들이 들어보셨을 것이다. 트랜스포머의 개념은 종종 매우 복잡한 다이어그램으로 제시되거나 복잡한 응용 프로그램에 배치되어 매우 난해하게 느껴질 수 있다. 그렇다면 어떻게 이것을 이해하기 시작해야 할까? 그러나 주의(attention)의 핵심 작업은 매우 직관적인 아이디어다. 이번 블로그에 마지막 부분에서는 이것이 왜 강력한지, 그리고 어떻게 트랜스포머와 같은 더 큰 신경망의 일부로 사용할 수 있는지 단계별로 분해하여 설명할 것이다.Intuition Behind Self-Atttention특히, 우리는 자기 주의(self-attention)에 초점을 맞출 것이다. 이는 입력 예제의 가장 중요한 부분에 주의를 기.. 2024. 6. 18. RNN Applications & Limitations(RNN 응용 사례 및 한계) 지금까지 RNN의 기본인 작동원리와 아키텍처, 학습 방법, 적용 분야 등을 살펴보았습니다. 이 세션의 마지막 부분에서는 소프트웨어 랩에서 RNN을 실제로 활용하는 구체적인 예시를 살펴보겠습니다.뮤직 제너레이션먼저 RNN을 사용하여 멜로디를 생성하는 뮤직 제너레이션 과제를 다룬다면, RNN은 시퀀스 데이터에서 다음 요소를 예측하는데 효과적이며, 이를 활용하여 완전히 새로운 멜로디를 만들 수 있다. 실제 사례: 슈베르트의 미완성 교향곡 3번몇년 전 연구팀 RNN 모델을 클래식 음악 데이터로 학습시켰다. 유명 슈베르트는 두 악장으로 구성된 미완성 교향곡을 남겼다. 불행히도 그는 교향곡을 완성하지 못한 채 세상을 떠났다. 연구팀은 학습된 RNN모델을 사용하여 기존의 두 악장 정보를 바탕으로 미완성된 제3악장을 .. 2024. 6. 17. Backpropagation Through Time(BPTT): 역전파 알고리즘 Recall: Backpropagation in Feed Forward Models 역전파 알고리즘을 사용하여 RNN을 학습하는 방법을 설명하고, 텍스트 분류 문제에서의 예시를 설명하겠습니다. RNN학습 과정(복습... :) ) 1. 데이터 준비: 시퀀스 데이터를 입력 데이터와 출력 데이터로 준비한다. 2. 모델 정의: RNN모델의 구조와 가중치를 정의한다. 3. 순전파: 입력 데이터는 단어 벡터로 변환되고 RNN을 통과한다. RNN은 각 단어를 처리하면서 숨겨진 상태를 업데이트한다. 예) "나는 피자를 좋아한다." 4. 출력 계층: 텍스트 분류 문제의 경우 출력 계층은 입력 문장이 특정 클래스에 속할 확률을 계산한다. 예) "음식" 카테고리에 속할 확률 5. 오류 계산: 네트워크의 예측값과 실제 값 간.. 2024. 3. 25. A Sequence Modeling Problem: Predict the Next Word (시퀀스 모델링 문제: 다음 단어 예측하기) A Sequence Modeling Problem: Predict the Next Word 이번에는 RNN을 사용하여 다음 단어를 예측하는 시퀀스 모델링 문제를 다룰 것이다. 시퀀스 모델링 문제는 주어진 단어 시퀀스의 다음 단어를 예측하는 것이다. 예를 들어, 다음 문장의 마지막 단어를 예측하는 문제를 생각해 보겠습니다. "이번 아침에 저는 고양이를 산책에 데리고 나갔습니다." "This morning I took my cat for a walk" 이 문장에서 RNN은 "산책에" 다음에 올 단어를 예측해야 한다. 하지만 뉴럴 네트워크는 자연어를 직접적으로 이해하지 못하기 때문에 텍스트 데이터를 숫자 벡터로 변환해야 한다. 텍스트 데이터를 숫자 벡터로 변환하는 방법은 다음과 같다. 1. 사전 생성: 모든 .. 2024. 3. 8. nn.Module로 구현하는 선형 회귀 이전 게시글은 직접적으로 가설을 제시해, 비용 함수를 직접 정의해서 선형 회귀 모델을 구현했다. 이번에는 파이토치에서 이미 구현되어 제공되고 있는 함수들을 불러오는 것으로 선형 회귀 모델을 구현해 보자. 단순 선형 회귀 구현하기 import torch import torch.nn as nn #torch.nn은 딥러닝 모델을 구성하는 레이어 및 모듈을 제공 import torch.nn.functional as F import torch.optim as optim torch.manual_seed(1) 필요한 도구들을 임포트 하고, 이제 데이터를 선언한다. 아래 데이터는 y= 2x를 가정된 상태에서 만들어진 데이터로 우리는 이미 정답이 W=2, b=0 임을 알고 있는 사태다. 모델이 이 두 W와 b의 값을 제.. 2024. 3. 4. 이전 1 2 3 4 5 다음 728x90