분석 Python/Numpy Tip(6)
-
Incredibly Fast Random Sampling in Python - 리뷰
샘플링을 어떻게 빠르게 할 수 있을까? numpy or random 패키지로도 할 수 있지만, 최근에 쉽게 해결할 수 없는 무작위 샘플링 문제를 발견했다고 합니다. 일단 구체적으로 필요한 것은 다음과 같다. A specified sample size (지정된 표본 크기) A specified number of samples (지정된 샘플수) Sampling without replacement A specified inclusion probability of each element’s inclusion in a given sample (주어진 표본에 각 요소가 포함될 확률을 명시) import random import numpy as np # constants num_elements = 20 num_sam..
2019.06.14 -
numpy.unique, numpy.searchsorted
카테고리를 정수로 변환하기! pandas에는 cat.codes가 있다. 유니크 범위 : ( 0 , 카레고리수 -1 ) from itertools import combinations possible_categories = list(map(lambda x: x[0] + x[1], list(combinations('abcdefghijklmn', 2)))) categories = np.random.choice(possible_categories, size=10000) print(categories) ['al' 'kl' 'jk' ... 'jm' 'bm' 'hj'] unique_categories, new_categories = np.unique(categories, return_inverse=True) print..
2019.05.26 -
Broadcasting, numpy.newaxis
numpy를 자주 쓰다 보면 사용하면 Broadcasting! https://docs.scipy.org/doc/numpy/user/basics.broadcasting.html Broadcasting — NumPy v1.16 Manual Broadcasting Note See this article for illustrations of broadcasting concepts. The term broadcasting describes how numpy treats arrays with different shapes during arithmetic operations. Subject to certain constraints, the smaller array is “broadcast” acro docs.scip..
2019.05.26 -
numpy argsort
argsort를 이용해서 하나의 기준이 있을 때 다른 것도 쉽게 정렬할 수 있다! 만약 키와 나이가 쌍이 있다고 하자. ages = np.random.randint(low=30, high=60, size=10) heights = np.random.randint(low=150, high=210, size=10) print(ages) print(heights) ## ages : [56 53 52 54 42 53 39 37 50 57] ## heights : [189 182 158 204 187 168 155 169 206 153] 이것을 나이를 기준으로 height 도 같이 sort해보자! 이 방식은 zip(ages , heights) 보다 훨씬 빠르다고 합니다!! sorter = np.argsort(age..
2019.05.26 -
넘파이 좋은 팁이 많음!
http://arogozhnikov.github.io/2015/09/29/NumpyTipsAndTricks1.html Data manipulation with numpy: tips and tricks, part 1 also, since algebra is you friend, you can do it times faster: $$||x_i - x_j||^2 = ||x_i||^2 + ||x_j||^2 - 2 (x_i, x_j) $$ so dot products is the only thing you need. arogozhnikov.github.io
2019.05.25 -
Numpy
딥러닝을 공부하는데 Numpy가 중요하다고 많은 사람들이 말을 해서 github에 exercies 올려주신 분이 있어서 물론 그 안에 들어가면 문제와 함께 답도 있지만, 개인적으로 문제만 보고 해보면서 답도 모르면 찾아보는 식으로 해봤습니다.여기서도 많이 배웠지만, 더 많은 Numpy에 대한 학습을 해서 딥러닝을 이해할 때 더 도움이 되도록 공부를 해야 할 것 같습니다. 참고 사이트 : https://github.com/Kyubyong/numpy_exercises 사이트를 몇 개 찾아봤는데, 적절한 것을 잘 찾지 못하는 구글링 실력으로 뒤져보다가 이 사이트는 NUMPY 부분에 대해서 전체적으로 다 나온 것 같아서 이것을 통해 NUMPY 를 좀 더 다양하고 깊게 공부해볼려고 합니다.다른 배울 사이트: ht..
2017.12.25