본문 바로가기

전체 글11

EasyOCR 간단 리뷰(Recognition) EasyOCREasyOCR은 Text Detection + Text Recognition으로 구분이 되어있고 Text Detection에서 텍스트의 위치를 파악하고 Recognition에서 문자 인식 기능을 수행합니다.현재 Text Detection은 따로 하고 있기 때문에, Text Recognition 위주입니다.Installationpip install pytorch (in your env)pip install easyocrEasyOCR은 Pytorch 기반으로 실행되기 때문에 자신의 환경에 맞는 Pytorch를 먼저 설치해야 합니다.Usageimport easyocrreader = easyocr.Reader(['ko','en']) result = reader.readtext('image.jpg').. 2024. 7. 4.
YOLO Custom Dataset YOLO를 Custom Dataset으로 학습하는 방법Object Detection 모델을 학습시키기 위해서는 이미지와 레이블이 필요합니다. 이번 글에서는 YOLO 모델을 커스텀 데이터셋을 사용해 학습하는 방법을 단계별로 설명하겠습니다.1. YAML 파일 생성하기이미지에 5개의 레이블과 바운딩 박스를 가진 데이터가 있다고 가정하면, YAML 파일은 다음과 같이 구성할 수 있습니다. path에는 데이터셋의 루트 디렉토리가 들어가고, train, val에는 해당 디렉토리의 경로를 작성하면 됩니다.path: ./data/ # dataset root dirtrain: images/train/ # train images val: images/val/ # val imagestest: # test images.. 2024. 5. 29.
8-BIT OPTIMIZERS VIA BLOCK-WISE QUANTIZATION Year: 2022원문: https://arxiv.org/abs/2110.02861저자: Facebook AI Research GitHub - TimDettmers/bitsandbytes: Accessible large language models via k-bit quantization for PyTorch.Accessible large language models via k-bit quantization for PyTorch. - TimDettmers/bitsandbytesgithub.com모델 크기를 늘리는것은 리소스에 대해 더 나은 성능을 달성하는 방법입니다. (Scaling Laws for Neural Language Models 논문 참고)이런 대규모 모델을 학습하려면 model, gradie.. 2024. 5. 3.
ollama baseline <figure id="og_1713500175398" contenteditable="false" data-ke-type="opengraph" data-ke-align="alignCenter" data-og-type="object" data-og-title="GitHub - ollama/ollama: Get up and running with Llama 3, Mistral, Gemma, and other large language models." data-og-description="Get up and running with Llama 3, Mistral, Gemma, and other large language models. - ollama/ollama" data-og-host="github.com" d.. 2024. 4. 19.