본문 바로가기

What am I Doing60

불면증 이때까지 살면서 한 번도 잠 드는데 어려움을 겪은적이 없었다.그런데 최근 들어, 잠에 드려는데도 머리속이 (연구 관련) 생각들로 가득 차 쉽사리 잠에 들지 못하고 있다.어제도 누운 채로 한시간 가까이를 뒤척였다.정확히 말하면, 그 누운와중에도 꿈은 꾼 것 같으니 일명 렘수면 상태로 매우 얕게 잠이 드는 듯 하다.이대로라면 정말 카페인 조절을 하거나, 수면제를 먹거나 해야겠다는 생각도 들었다.내가 이런 생각을 하게될 줄이야,연구는 나를 바꾸고있다. 2025. 2. 10.
연구, 정말 어렵다. 답이 없는 문제를 직접 해결해야한다는 것은 정말 어려운 과제다.시키는 일을 하는 것은, 크게 어렵지 않다. 이제는 나의 연구를 해야 할 때,문제는 명확히 발견한 것 같으나, 그것을 해결할 수 있는 접근법들이 쉽사리 정리되지 않는다.몇가지 어프로치(Approach)들이 피상적으로만 내 머리속 한 곳을 둥둥 떠다닌다.이것들에 지배당한 채로, 늘 생각하고 생각하는데, 아직은 잘 모르겠다. 2025. 1. 23.
나는 누군가 인생의 첫줄이다. 동네 치과를 갔다.진료 순번을 대기하며 건물벽 한편에 쓰여진 치과의사 선생님의 이력을 읽어보았다.첫줄은 ...치의과대학원 석사 로 시작했다.그 밑으로 수많은 이력들이 빼곡히 적혀져있었다.그때 깨달았다, 아,나는 겨우 지금 누군가의 커리어의 첫 줄을 살아가고 있구나,지금은 세상 다 산 것 같고, 때론 주변보다 늦고 부족하여 뒤쳐지는 것 같지만,내겐 아직 많은 기회들이 열려있겠구나.또 그만큼 더 많은 공부를 해야겠구나 하는 깨달음을 얻었다. 2025. 1. 20.
시간날 때 틈틈히 기록해보는 2024년 회고 - 1 실험 중 모델 체크포인트 로드를 기다리며 잠시 글을 써본다. 2024년은 나름대로 욕심을 많이 내려놓은 한 해였다. 나는 본래 다양한 활동이나 도전하는 것을 좋아하여, 늘 병렬적으로 다양한 활동을 진행해왔었다. 그것이 공부가 됐든, 어떤 동아리나 학생회같은 교내 활동이 됐든 말이다. 그러나 2024년은, ( 연구자의 길로 들어서기 위해) 정말 진중하고 많은 공부가 필요하다고 생각되어 과감히 연구실 외 모든 활동은 하지 않았다. 틈틈히 들여다보던 인턴 공고 사이트도 더 이상 들여다보지 않았으며, 쿠플라이 개발 작업에서도 빠졌다. 금주도 시작하고 사람과의 약속도 거의 잡지 않았으며, 특히 2학기는 그냥 나홀로 생활 그자체를 보냈다.  이처럼 2024년은 나름대로 정말 연구에만 집중하려고 노력한 한 해였다. .. 2025. 1. 5.
Imitation Learning 이란? (vs. SFT) 최근 MLLM 에 RLHF 와 같은 (비교적) 가벼운 Human Alignment 기법을 통해 Image Generation (T2I) 성능을 향상시키기 위한 방법론 (알고리즘) 을 연구하고 있다. 그 과정에서 Imitation learning 이라는 개념을 알게 되었다. Imitation Learning 은 강화 학습 (Reinforcement Learning) 에서 사용되는 개념으로서 크게는 아래의 것들을 포괄한다.- Behavioral cloning- Inverse RL 구체적인 설명은 아래 블로그들에서 잘 설명해두었더라.https://jhrobotics.tistory.com/37https://mech-literacy.tistory.com/24 내가 헷갈렸던 부분은, IR (Imitation Lea.. 2024. 11. 11.
우당탕탕 연구실 생활 - 4월/5월 회고 4월 회고를 작성해야지... 해야지... 하다가 어느덧 5월이 끝나버렸다. 글 한 편 작성하는 시간을 내는 것조차 버거운 나날들이다. 이렇게 된 김에 4월과 5월을 합쳐, 회고글을 작성하기로 마음먹었다. 크게 바라보면, 4월은 중간고사와 두 연구실의 일, 그리고 대학원 원서접수가 겹쳐 체력적으로 많이 힘들었던 한달, 5월은 파이토치 라이트닝 기반의 코드 리팩토링에 열중했던 한달로 요약해볼 수 있을 것 같다. 너무나 정신없이 한 학기를 보낸 나머지, 벌써 종강을 맞이하고 7월 3일이 되었다. 우선 4월달의 기억을 되짚어 보면, 두가지 사건이 강렬하게 뇌리에 스친다. 그 중 1) 첫번째는 연구실에 들어와 처음으로 모델 학습 띄우기를 성공한 사건이고, 2) 두번째는 연구실 메인 서버에 사고를 친 사건이다.  .. 2024. 7. 3.
반응형