'분류 전체보기' 카테고리의 글 목록 (4 Page)

[Deep Learning & Machine Learning] Batch Iterator 만들어보자

Batch Iteration 배치 반복(Batch Iteration)은 머신 러닝 및 데이터 처리에서 대용량 데이터 세트를 보다 효율적으로 처리하기 위해 사용되는 스킬입니다. 메모리 집약적일 수 있는 전체 데이터 세트를 한 번에 처리하는 대신, 데이터는 더 작고 관리하기 쉬운 배치로 처리됩니다. Batch Iterator(배치 반복자)를 만드는 단계별 방법은 아래와 같습니다. - 샘플 수 결정(Dtermine the Number of Samples) : 데이터 세트의 총 샘플 수를 계산합니다. - 배치로 반복(Iterate in Batches) : 지정된 배치 크기 단위로 데이터 세트를 반복합니다. - 배치 생성(Yield Batches) : 각 반복에서 X에서 샘플 배치를 생성하고, 만약 제공된 경..

format_list_bulleted Data science/Machine Learning basic
· 2024. 8. 1.

RSV(호흡기세포융합바이러스)를 연구해보자! - 미국 데이터로 알아보는 RSV와 Bronchiolitis

Introduction 3개월 전 다른 연구실 교수님의 요청으로 한국의 RSV와 인플루엔자에 대해 저희 연구실과 공동연구를 제안하였습니다. 연구 관련된 논문을 하나 보내주셔서 해당 논문의 분석 기법을 공부하고 킥오프 미팅을 마쳤죠. 한국에서 RSV에 관련된 연구를 수행하기 위해서는 이 질병과 관련된 데이터가 필요하기에 건강보험공단의 데이터 사용을 위해 신청 후 대기 중인 상태입니다.(건보 데이터는 직접 추출하기 위해서 원주까지 가야함..) 무한 대기 중인 상태인데, 연구책임자이신 교수님께서 Group knowledge 증진을 위해 Research Study를 제안하셨습니다.늘 그렇듯 이런 일정이 잡히면 말단인 저는 보내주신 논문을 읽고 정리하고 준비를 해야합니다. 이왕 준비하는 김에 읽었던 논문과 몰랐..

format_list_bulleted Medical
· 2024. 7. 17.

[논문리뷰] Vision language models are blind - VLM은 사실 장님이었나 ?

Introduction 최근 8개월 동안 Vision Language Models (VLMs)의 발전으로 다양한 이미지-텍스트 처리가 가능해졌습니다. VLM들은 장면 내 객체 식별, 복잡한 작업 수행 등에서 뛰어난 성능을 보이고 있습니다. 현재의 VLM 벤치마크들은 인간과 AI 간의 전반적인 격차를 측정하지만, 구체적인 시각적 한계를 지적하지는 않습니다.이 논문은 VLM이 실제로 인간처럼 이미지를 "보는지" 검증하기 위해 로우 레벨 차원에서 시각 작업에 대한 새로운 벤치마크를 제안합니다. 이 벤치마크는 2D 기하학적 도형만을 포함하며, 최소한의 지식을 요구합니다.연구진은 4개의 최신 VLM (GPT-4V, Gemini-1.5 Pro, Claude-3 Sonnet, Claude-3.5 Sonnet)을 8가..

format_list_bulleted 카테고리 없음
· 2024. 7. 11.

[논문리뷰] - ECG(심전도), PPG(광전용적맥파) feature extraction 연구 논문을 읽어봅시다. ( ECG feature extraction , 심전도 인공지능 )

1. Introduction 생체신호와 관련된 프로젝트를 진행하고 있는데, 가장 어려운 부분은 역시나 메디컬 도메인 지식입니다.작년 말부터 진행 중이었던 현재 프로젝트를 너무 데이터 그 자체와 약간의 도메인 지식 그리고 인공지능 모델링 측면에서만 봐서 그런지 너무나 더딘 개선 속도가 마음에 걸려서 처음으로 돌아왔습니다. 많은 생체신호 데이터를 사용 중이지만, 그 중에서도 가장 중심적으로 활용이 되어야 하는 ECG와 PPG에 관해서 조금 더 deep하게 알아볼 것입니다. 개별적인 논문을 모두 자세히 보려고 했지만, 사실 ECG라는 데이터로 할 수 있는 연구가 너무나 많다보니 Feature Extraction 역시 각 연구의 목적에 따라 처리 방법이 너무나 다릅니다. 제가 가지고 있는 데이터는 125Hz인..

format_list_bulleted Data science/딥러닝 논문 리뷰
· 2024. 7. 10.

[Insight] Scale’s Alex Wang on the US-China AI Race - Scale AI의 수장 Alex Wang이 말하는 AI 전쟁

최근 Scale AI의 CEO인 Alex Wang의 인터뷰가 담긴 팟캐스트를 들었는데요, AI가 글로벌 권력 균형을 어떻게 변화시킬 수 있는지에 대한 Alex Wang(Scale AI의 CEO)의 인사이트가 인상적입니다. (https://www.chinatalk.media/p/scales-alex-wang-on-the-us-china) Scale AI라는 회사는 AI 트레이닝 데이터 라벨링을 위한 API를 제공하는 비즈니스 모델을 가지고 있는 회사입니다. 특히, 자율 주행 관련 데이터를 필요로 하는 Waymo, Uber 등의 기업이 주요 고객이라고 합니다. 본 인터뷰는 ChinaTalk 에서 진행했습니다. 인공지능의 발전에 빼놓을 수 없는 국가가 중국이죠 ? 자율주행은 물론 데이터의 절대적인 양을 따..

format_list_bulleted Insight
· 2024. 6. 26.

[Insight] Claude 3.5 Sonnet 발표. OpenAI를 압도하는 Antropic

Antropic ?! 엄청난 LLM product가 또 출시되었습니다.매주마다 LLM 관련 다양한 논문들이 나오고 있는데요, 저번주에는 정말 엄청난 프로덕트가 출시되었네요. Antropic의 Claude 3.5 Sonnet 출시 소식입니다.올해 3월 Antropic은 Claude 3.0 모델을 출시하면서 ChatGPT-4 보다 더 성능이 좋은 모델을 공개했습니다. Claude3.0은 Opus, Sonnet, Haiku라는 3가지 모델로 이루어져 있는데요, 각 모델은 성능뿐만 아니라 윤리성 검증까지 마친 상태라고 했죠. 엔트로픽은 OpenAI의 엔지니어들이 샘 알트만의 행보에 반대하여 퇴사 후 설립한 회사입니다. ( 샘 알트만의 영리화 정책 )Antropic은 OpenAI와 차별성을 두기 위해 공익회사임..

format_list_bulleted Insight
· 2024. 6. 24.