본문 바로가기

전체 글

sklearn model 백업, 재사용 sklearn 내부의 pickle lib 를 통해 모델을 저장하고 다시 로드하여 재사용할 수 있다. from sklearn import svm from sklearn import datasets clf = svm.SVC() iris = datasets.load_iris() X, y = iris.data, iris.target clf.fit(X, y) import pickle s = pickle.dumps(clf) clf2 = pickle.loads(s) clf2.predict(X[0:1]) y[0] 아래 api를 통해 file 저장도 가능한 듯 하다. 자세한 내용은 pickle 홈페이지에 있다. https://docs.python.org/2/library/pickle.htmlpickle.dump(obj,.. 더보기
sklearn 성능 측정 sklearn 의 성능을 측정할 수 있는 여러가지 Api 를 제공하고 있다. 아래 블로그에 sklearn을 통해 learn 된 데이터에 대해 성능 평가 방법에 대해 설명하고 있다. http://antilibrary.org/1067 더보기
Scikit learn (Python) 통계정리를 위한 파이썬 라이브러리 Sci-kit learn 을 접하게 되었다. 머신 러닝의 기초가 되는 각종 Regression에 대한 예제가 잘 정리되어 있다. http://scikit-learn.org/stable/# 더보기
머신러닝 배우는 방법 잘 정리되어 있는 사이트가 있어서 기록해 둔다.https://brunch.co.kr/@aidenswmo/2 더보기
python3에서 tk install sudo apt-get install tk8.6-dev Download/python3에서 configure Make Make install 더보기
Logistic regression cost function (펌) 11. Logistic Regression의 cost 함수 설명 (lec 05-2)동영상이 2개로 되어 있어서 글도 두 개로 정리한다. 이번 동영상에서는 cost 함수와 gradient descent 알고리듬에 대해서 공부한다. Linear Regression에서 배운 hypothesis와 이번에 배운 hypothesis를 비교해서 보여주고 있다. hypothesis는 cost 함수를 구성하는 핵심이기 때문에, 여기서는 cost 함수 또한 이전과 달라져야 한다고 얘기하고 있다.그림의 왼쪽 부분은 매끈한 밥그릇이고, 오른쪽 부분은 울퉁불퉁하다. 김성훈 교수님은 이 부분에 대해서 왼쪽은 직선을 살짝 구부려서 연결을 한 모양이고, 오른쪽은 sigmoid를 구부려서 연결을 했기 때문이라고 설명하셨.. 더보기
Logistic Classification (펌) 10. Logistic Classification의 가설 함수 정의 (lec 05-1)이번 글부터 2주차에 해당한다. 1주차에 너무 고생을 해서 2주차는 쉽겠거니 했는데, 여전히 새로운 것들은 이해가 되지 않는다. 그래도 아는 만큼 정리해 본다.이전에 다룬 내용은 좌표상에 위치한 데이터를 가로지르는 직선을 그어서 새로운 데이터의 위치를 예측하는 Linear Regression 모델이었다. 물론 feature가 여러 개인 multi-variables인 경우에는 당연히 직선으로 표시되지 않겠지만, 나에게는 이 정도의 설명이 딱 좋은 것 같다.이번에 공부한 내용은 Linear Regression을 활용해서 데이터를 분류하는 모델이다. 이름은 Logistic Classification이라고 부.. 더보기
tensorflow Variable tensorflow에서는 변수를 초기화 시켜주어야 한다. 초기화된 변수는 saver / restore를 통해 저장, 복구 할 수 있다. https://github.com/tensorflowkorea/tensorflow-kr/blob/master/g3doc/how_tos/variables/index.md 더보기