본문 바로가기

전체 글

ms word python 에서 사용하기 python-docx lib사용 더보기
네이버 뉴스 크롤링하기 (퍼옴) [데이터분석] 파이썬으로 특정 키워드를 포함하는 신문기사 웹크롤링 & 워드클라우드 시각화 분석 - 2 (네이버 뉴스 크롤링하기)윤빵꾸 2016.08.26 15:44 네이버 뉴스 크롤링하기 이번 글에서는 동아일보와 한겨레신문에서 특정 키워드를 포함하는 기사를 긁어오기 전 예제로 네이버포털의 뉴스기사를 긁어 오는 것을 먼저 연습하도록 하겠습니다. 1234567891011121314151617181920212223242526272829303132"""네이버 뉴스 기사 웹 크롤러 모듈""" from bs4 import BeautifulSoupimport urllib.request # 출력 파일 명OUTPUT_FILE_NAME = 'output.txt'# 긁어 올 URLURL = 'http://news.naver.. 더보기
Relu: Relu vs sigmod 신앙처럼 여겨왔던 sigmoid를 능가하는 존재가 나타났다. 여기서는 Deep Learning의 성능을 향상시키는 다양한 방법들에 대해 알려준다. sigmoid는 logistic classification에서 어디에 속하는지 분류를 하기 위해 사용했다. 일정 값을 넘어야 성공내지는 참(True)이 될 수 있기 때문에 Activation function이라고도 불렀다. 업계 최고라고 부르는 9단이 나타났다. 9개의 hidden layer에 맞게 W와 b 또한 그 만큼의 갯수로 늘어났다. 그러나, 코드가 어렵지는 않다. 지루한 반복같은 느낌이다. TensorBoard로 결과를 보기 위한 코드도 추가했다. (그림 오른쪽 코드) 각각의 layer가 그래프의 노드가 되어 표시되었다. 보기 좋다. 그런데, 결과는 .. 더보기
Tensorflow 소스 코드 분석 요즘 핫 이슈인 TensorFlow의 백서(white paper)를 기반으로 속살(source code)을 파헤쳐 보고 정리한 자료를 다음과 같이 공유합니다.잘못된 분석이 있다면 댓글로 남겨주시면 감사드리겠습니다. Tensorflow internal from Cho Hyunghun 아래는 각 슬라이드 별 내용을 간략히 설명한 것입니다. 참고하시기 바랍니다. TensorFlow의 주요 특징 Dataflow 형태의 모델을 기반으로 손쉽게 딥러닝 프로그래밍할 수 있도록 제공 모델을 다양한 디바이스(CPU, GPU, 원격)에서 효율적으로 분산 처리전자를 통해 분석할 데이터를 효과적으로 처리(Extract, Transform, Load - ETL)하고 다양한 학습 모델을 활용할 수 있으며 추후 손쉽게 도식화할 수.. 더보기
ReLU (Rectified Linear Unit) 1. Neural Network라는 개념이 재밌지만 사실 몇가지 문제가 있다. 첫번째로는 Neural Network가 느리다는 점이다. 실제로 Neural Network의 학습은 상당히 오래걸리는 편이다. 특히 Unit(Neuron)이 많아지면 점점 더 시간이 늘어난다. (솔직히 언젠가는 이것이 하드웨어적으로 해결되어야 할 문제라고 생각한다.) 그리고 또한가지 가장 큰 문제중 하나는 Gradient Vanishing 이라는 문제이다. hidden layer가 한개, 두개일때는 문제가 생기지 않지만 네트워크가 깊어지면 깊어질수록(Deep Learning은 깊은 네트워크를 이용하면 Deep Learning이다. 뭔가 말장난 같지만 장난이 아니라 진짜다.) Gradient Vanishing 문제가 생긴다. G.. 더보기
Machine learning 종류 Supervised Unsupervised learning Reinfoece learning 더보기
Tensor Flow란 보호되어 있는 글입니다. 더보기
맥에서 아이폰 패킷 수집 방법 Wireshark 사용http://www.wireshark.org/download.html 더보기