본문 바로가기

728x90

전체 글

(170)
[혼공머신] CHAPTER 03-3 특성공학과 규제 전 챕터에서 훈련세트보다 테스트세트의 점수가 높아서 이 문제를 해결하기 위해 제곱보다 더 고차항이 필요. -> 특성 공학을 이용해 특성을 많이 만들어내서 고차원에서 선형 회귀가 복잡한 모델을 표현하려고 한다.(?) 다중회귀(multiple regression) - 여러 개의 특성을 사용한 선형 회귀 - 특성이 많으면 선형 모델이 강력한 성능을 발휘한다 >> 여기에서는 농어의 길이, 높이, 두께 사용! 특성 공학(feature engineering) - 기존의 특성을 사용해 새로운 특성을 뽑아내는 작업 - ex) 농어 길이 x 농어 높이 - 각 특성을 서로 곱해서 또 다른 특성을 만들어낸다 판다스(pandas) - 파이썬 데이터 처리를 위한 라이브러리 - 관례적으로 pd라는 명칭으로 임포트 - 3가지의 데..
[혼공머신] CHAPTER 03-2 선형회귀 챕터03-1과 같이 농어 데이터를 훈련세트와 테스트세트로 나누어서 2차원 배열로 변환한다. 몸 길이가 50cm인 농어의 무게를 예측해보았는데 1033g으로 예측했다 -> 농어의 실제 무게가 아니다! 그래서 산점도 그래프를 그려보았더니 산점도를 보면 길이가 커질수록 농어의 무게가 증가하지만, 50cm 길이의 농어에서 가장 가까운 데이터는 45cm 근방이기 때문에 k-최근접 이웃 알고리즘은 이 샘플들의 무게를 평균한다 이웃 샘플의 타깃의 평균을 구하면 50cm의 농어의 무게와 일치하는 것을 확인할 수 있다. 즉, 농어의 길이가 아무리 늘어나도 무게는 1033g으로 예측한다는 의미이다 선형 회귀(linear regression) - 특성이 하나인 경우 특성을 가장 잘 나타내는 직선을 학습하는 알고리즘 - 머신..
[혼공머신] CHAPTER 03-1 k-최근접 이웃 회귀 회귀(regression) - 임의의 어떤 숫자를 예측하는 문제 - 두 변수 사이의 상관관계를 분석하는 방법 k-최근접 이웃 회귀 - 분류와 같이 예측하려는 샘플에 가장 가까운 샘플 k개를 선택 - 이웃 샘플의 수치를 활용해 새로운 샘플 x의 타깃은 평균으로 예측 1. 데이터 산점도 - 2장에서는 특성을 2개를 사용해서 열이 2개인 2차원 배열을 사용했지만, 여기에서는 특성 1개만 사용해야해서 수동으로 2차원 배열을 만들어야한다. 그래서 넘파이 배열이 크기를 바꿀 수 있는 reshape() 메서드를 사용한다. reshape( ) 이런 식으로 reshape()를 이용해 배열의 크기를 변경한다. reshape(-1, n) : 크기에 -1을 지정하면 나머지 원소 개수로 모두 채우라는 의미 KNeighborsR..
[혼공머신] CHAPTER 02 데이터 다루기 지도 학습이란? - 정답이 있는 데이터를 활용해 데이터를 학습시키는 것 비지도 학습이란? - 정답이 없는 데이터를 비슷한 특징끼리 군집화 하여 새로운 데이터에 대한 결과를 예측하는 방법 CHAPTER 01에서는 도미인지 아닌지 여부를 정답으로 하였다. 지도 학습에서는 데이터와 정답을 입력(input)과 타깃(target)이라고 하고, 이 둘을 합쳐서 훈련 데이터라고 한다. 특성 : 입력으로 사용된 길이와 무게 CHAPTER 01의 문제점 : 이미 입력된 정답을 가지고 테스트했기 때문에 정확한 답을 맞추는 게 가능 머신러닝 알고리즘의 성능을 제대로 평가하려면 훈련 데이터와 평가에 사용할 데이터가 각각 달라야한다. 그래서 제대로 평가하기 위해서 이미 준비된 데이터 중에서 일부를 활용하거나 새로운 데이터를 준..
[혼공머신] CHAPTER 01 나의 첫 머신러닝 인공지능이란? - 사람처럼 학습하고 추론할 수 있는 지능을 가진 컴퓨터 시스템을 만드는 기술 머신러닝이란? - 규칙을 일일이 프로그래밍 하지 않아도 자동으로 데이터에서 규칙을 학습하는 알고리즘을 연구하는 분야 - 대표적인 머신러닝 라이브러리는 사이킷런(scikit-learn) 딥러닝이란? - 많은 머신러닝 알고리즘 중에 인공 신경망을 기반으로 한 방법들을 통칭하여 부른다 - 2015년 구글이 딥러닝 라이브러리인 텐서플로를 오픈소스로 공개 BreamAndSmelt.ipynb - 가장 간단한 머신러닝의 예시로 도미와 빙어를 분류해보자 - 35마리의 도미 - 14마리의 빙어 특성(feature) : 도미의 특징을 길이와 무게로 표현한 것 산점도(scatter plot) : 길이를 x축, 무게를 y축으로 하고 ..
[혼공학습단 6기] 소감과 혼자 공부하는 파이썬 리뷰 혼공학습단 6기에 참여하게 되어 6주 동안 을 공부했다! 기간도 딱 여름방학이여서 방학을 나름 알차게 보냈다고 할 수 있을 정도?! 주 차별로 있는 미션을 완료하면 페이스북 페이지에 해당하는 해시태그와 같이 올리면 된다. 혼공족장님의 격려와 칭찬을 말씀이 참 따뜻했다. 주 차별 우수 혼공러가 되면 스타벅스 아메리카노나 초콜릿을 보내주셨다. 이것도 정말 쏠쏠하게 잘 먹었다^~^ 주 차별로 어디를 공부해야할지, 무엇을 공부해야할지 정해져 있어서 따로 계획을 짜지 않아도 된다는 점이 편했다. 아쉬웠던 건 미션 내용이 한정적이라 공부하다보면 미션 내용 부분만 공부하게 된다는...큰 단점이 있었다. 나만 이런 걸 수도 있지만.. ^^,, 그리고 나는 심화 과정을 원했는데 아무래도 출판사에서 주관하고, 초보자들을 ..
[혼공학습단 6기] 혼자 공부하는 파이썬 혼공노트 공유 6주 동안 달려온 흔적들 공유하기! 혼공파 1주차 기본 미션 [혼공챌린지] 1주차 혼공파 파이썬 기본미션 (tistory.com) [혼공챌린지] 1주차 혼공파 파이썬 기본미션 1주차 기본미션: p63 3~5번 실행결과 쓰고 인증샷 3번 풀이) 역슬래시는 두 번 쓰면 역슬래시 한 번으로 나타난다. *를 이용해 글자를 여러 번 출력할 수 있다. 4번 풀이) 파이썬은 인덱싱할 때 0부터 engine.tistory.com 혼공파 1주차 선택미션 [혼공챌린지] 1주차 혼공파 파이썬 선택미션 (tistory.com) [혼공챌린지] 1주차 혼공파 파이썬 선택미션 혼공 노트에 정리하라고 되어 있는데, 혼공 노트 칸이 적은데 어떻게 정리하라는 건지 몰라서 아이패드에 썼다 파이썬에서 작은따옴표 쓰는 거 계속 까먹었었는데 ..
[리눅스] 메일 서버 SMTP(Simple Mail Transfer Protocol) : 클라이언트가 메일을 보내거나 메일 서버끼리 메일을 주고 받을 때 사용 POP3(Post Office Protocol) : 메일 서버에 도착한 메일을 클라이언트로 가져올 때 사용 IMAP(Internet Mail Access Protocol) : POP3와 같은 용도 apt -y install sendmail nano /etc/hostname nano /etc/hosts nano /etc/mail/local-host-names reboot명령어로 재부팅한다 hostname 명령어를 치면 mail.bserver.com로 호스트이름이 바뀌었음을 알 수 있다! 위와 똑같은 방식으로 server도 수정해주면 된다! Server에 server.co..

728x90