[백준] BOJ 1004, 어린 왕자 파이썬 Python
·
IT, Digital
서론이번 포스팅에서는 백준 1004번 어린 왕자 문제를 풀겠다. 우선 어떻게 풀이 과정에 도달했는지에 설명하고 이어서 코드를 작성하는것으로 마무리할 예정이다. 백준 1004 문제를 보려면 여기로 가면 된다. 처음에 뭐야저거 했는데 쟤 그정도 아닙니다. 은하수 지도라고하는 참고용 도표만 없었어도 푼 사람 훨씬 많지 않았을까 싶다.BOJ 1004 풀이 과정 1문제를 보면 결국 요구하는게 출발점에서 도착점까지 몇개의 원을 통과해야 하는 지다. 은하수 지도를 보면 하나의 포물선으로 그려져 있으나 와리가리를 어떻게 해도 된다. 그냥 몇 개의 원을 지나는 지 구하기만 하면 되기 때문이다. 내가 이 문제를 풀었던 사고의 흐름을 보면 첫번째로 출발점 입장에서 왜 이 원은 지나야 하는지, 왜 이 원은 안 지나도 되는 지..
타오바오 커피 캡슐 보관함 구매기
·
쇼핑
서론최근 타오바오에서 커피 캡슐 보관함을 샀다. 근데 나는 커피 캡슐을 보관하려는 목적은 아니었고, 각종 간식들을 넣을 생각이었다. 매번 박스 채로 있는 게 보기가 영 좋지 않았기 때문이다. 해당 제품의 배송 과정은 여기서 확인하면 된다. 본 포스팅에서는 이 제품의 가격 및 제품에 대해서 얘기하고자 한다. 한 달동안 사용해본 사용기도 적어놨다.커피 캡슐 보관함 설명우선 이 보관함의 크기는 위에 사진과도 같다. 저 가운데 25cm는 직경을 의미하는 것일까? 대충 직경 24cm라고 하는게 맞을 거 같다. 25나 24나 그게 그거겠지만 말이다. 아무튼 꽤 큰 크기를 갖고 있다. 그리고 재질은 전체가 금속으로 되어 있어서 꽤 묵직하다. 사실 아래 부분이랑 손잡이만 알루미늄으로 되어 있는 줄 알았는데 원 전체가 ..
Fine-tuning LLM (5) fine-tuning
·
IT, Digital
서론지난 포스팅에서는 데이터를 curating하고 저장하는데 까지 진행했다. 이번 포스팅에서는 저장한 데이터를 가져와서, openai 모델을 파인튜닝하는걸 진행하도록 하겠다. 드디어 파인튜닝 시리즈의 마지막 단계가 온 것이다. 만약에 이전까지의 과정을 못봤다면 지난 포스팅을 꼭 보길 바란다. 여기서부터 시작할수가 없음. 지난 포스팅은 아래 링크부터 시작해서 링크의 마지막 숫자를 2,3,4로 바꾸면 됨. Fine-tuning LLM (1) Data Curation과 데이터 수집 및 로드서론이번 포스팅에서는 Fine-tuning을 위한 과정에 대해서 서술하고자 한다. 모델 성능 개선 방법에는 크게 세가지가 있다. 1. Prompting 2. RAG 3. Fine-tuning. 이 중 파인튜닝은 모델 자체를 ..
Fine-tuning LLM (4) Load & Download data
·
IT, Digital
서론지난 포스팅에서는 데이터를 정제하는 코드를 작성했다. 이번 포스팅에서는 데이터를 로드하고 로드된 데이터를 저장하는 방법에 대해서 적도록 하겠다. 이전 포스팅을 보려면 아래 포스팅을 참고하길 바란다. 여기서 만든 클래스를 활용해서 정제된 데이터를 로딩하는 것이기에 꼭 필요한 과정이다. Fine-tuning LLM (3) Item Parsing Class서론지난 포스팅에서는 데이터셋을 어떻게 수집하고, 데이터를 어떻게 분석하는 지 그 과정에 대해서 알아보았다. 이번 포스팅에서는 이렇게 분석한 데이터를 어떻게 프롬프트에 반영하는지에quiseol.cominit 함수와 load 함수우선 init함수를 통해 name과 dataset을 초기화한다. name은 카테고리명을, dataset은 데이터셋을 나중에 로드..
Fine-tuning LLM (3) Item Parsing Class
·
IT, Digital
서론지난 포스팅에서는 데이터셋을 어떻게 수집하고, 데이터를 어떻게 분석하는 지 그 과정에 대해서 알아보았다. 이번 포스팅에서는 이렇게 분석한 데이터를 어떻게 프롬프트에 반영하는지에 대해서 알아보고자 한다. 이렇게 만든 프롬프트를 기반으로 prompt를 만든 다음 나중에 Fine-tuning에 사용할 예정이다.생성자 설정 __init__()우선 초기 상태 설정인 init 함수를 적어준다. 받는 값들은 미리 넣어줄 것이고, 나중에 판단하거나 값을 새로 할당해야되는 것들은 None, 0 내지 False로 지정해줬다. detail을 바로 data['detail']로 받지 않은 이유는 디테일에 불필요한 요소가 너무 많기에 따로 받아서 정제를 해줘야되기 때문이다. 우선 데이터를 받으면 파싱하는 함수를 만들겠다.d..