의사결정나무: Decision Tree
·
AI Study/Machine Learning
[분류 문제]• 신규고객에게 신용카드를 발급하려고 하는데 어느 등급으로 해야 할까?• 어떤 부류의 고객이 신용등급이 높을까?• 어떤 구매자가 반품할 확률이 높을까?• 새로 관찰한 식물은 어느 종에 속할까? 디시전 트리 분석- 데이터를 여러 그룹으로 분류하여 변수간 나타나는 의사결정규칙을 트리구조로 분류하는 방법 디시전 트리를 만드는 알고리즘- 엔트로피와 정보획득이론을 기반으로 하는 머신러닝 분야의 ID3, C4.5, C5.0 알고리즘- 통계학에 기반으로 둔 CART와 CHAID C5.0- 엔트로피(entropy)와 정보이득(information gain) 개념에 기반을 둠- 초기 목표변수의 데이터들이 혼재되어 있으면 무질서도, 엔트로피가 큼.- 입력변수들의 데이터들을 분류하는 과정에서 목표변수의 데이터가..
SVM: Support Vector Machine
·
AI Study/Machine Learning
서포트 벡터 머신 - 지도학습, 분류 및 회귀분석에 유용 - 어느 그룹에 속하는지 판단하는 이진 분류와 다중 분류에 응용 - 선형 또는 비선형 회귀문제에 응용 SVM은 클래스를 구분 짓는 거리의 마진(margin)을 최대로 하는 초평면(hyperplane)을 찾고 새로운 개체를 분류하는 방법. 라그랑주 승수법* 초평면을 구하기 위한 수학 비선형 문제차원을 늘리면 해결됨. 저차원 To 고차원 매핑함수 φ가 여러개임. Linear, Polynomial 등. 이런식으로 non-linear 문제가 linear problem으로 바뀜.But φ를 실제로 모든 point에 적용해서 변환하면 메모리와 시간이 엄청나게 들어감. So, 커널함수를 사용. 우리는 고차원으로 변환한 데이터가 필요한 게..
K-최근접 이웃: KNN, K-nearest neighbors
·
AI Study/Machine Learning
분류문제: 새로운 개체와 특성이 가장 가까운 K개의 유사 개체들을 추출하여 빈도가 높은 특정 클래스로 분류.회귀문제: 유사 개체들의 정량적인 목표 값을 이용하여 하나의 수치적 값을 예측. [활용 예]▪ 분류문제 - 새로 가입한 고객은 어떤 그룹에 속할까? - 새롭게 가입한 회원에게 어떤 영화를 추천할까? - 저 음악 어떤 장르로 분류할 수 있을까? ▪ 회귀문제 - 고객들의 소득을 파악하면 우리 백화점의 구매금액을 추정할 수 있을까? - 방의 수와 범죄율을 알면 주택 가격을 추정할 수 있을까? 목표 변수가 범주 변수인 경우: 새로운데이터와 가장 가까운 거리(유사도)에 있는 K개개체들의 다수 분류에 따라 분류.목표 변수가 양적 변수인 경우: 가장 인접한 K개의 목표 변수의 평균 값..
연관분석: Apriori Algorithm
·
AI Study/Machine Learning
연관분석: 대용량 데이터베이스에서 빈도가 높은 아이템 간 연관규칙을 발견하는 기법머신러닝의 비지도학습 평가지표: 지지도, 신뢰도, 리프트지지도 신뢰도 리프트 연관분석 절차* 최종적으로 2항목 이상의 빈발 항목 집합에 대한신뢰도와 리프트를 구하여 연관규칙을 발견한다. 지지도 40% 이상만 필터링 - Confidence 70% 이상만 필터링 - Lift 100% 이상만 필터링.(이때 값은 탐색적 데이터 분석 후 결정) 실습1단계: 패키지 임포트from mlxtend.frequent_patterns import apriori, association_rulesfrom mlxtend.preprocessing import TransactionEncoderimport pandas as pdimport matpl..
2025년 리눅스마스터 1급 2502 필기 및 실기 합격 후기와 팁
·
자격증/리눅스마스터
2502 후기라고 했지만 사실 필기는 2401회를 응시했다. 공부를 시작하고 나서 후회를 안 한 날이 없는 것 같다.공부할 양이 너무너무너무 많기 때문... 정보처리기사에 비해 1.5배 정도 어려운 것 같다. 합격률 보이는 것 처럼 극악의 합격률을 보여준다. 합격률만 보면 정보보안기사급인데. 리눅스마스터가 그정도 권위를 가지는가? 아니다...필기 공부를 하면서 중간에 그냥 포기하고 싶었으나 공부를 꽤 많이 했어서 꾸덕꾸덕 그냥 했다.그런데 어쩔, 필기를 붙어버린 것. 이때부터 삶의 질이 떨어지기 시작했다... 필기 필기는 4지선다형으로 되어있다. 공인 자격증인 만큼 CBT 문제가 잘 되어 있어서 기출문제 수집이 어렵진 않았다.But 매 회차마다 출제 유형이 너무 달라서 힘들었다. 유형이 다르다기 보..
컨테이너
·
CS/운영체제
컨테이너• 애플리케이션이 독립된 실행공간을 확보하도록 하는 운영체제 수준의 가상화 기술• "독립된 실행공간 확보": • 애플리케이션의 독립된 실행을 위해 자원을 격리함 • 애플리케이션 코드 실행에 필요한 요소(라이브러리등)를 묶음• "운영체제수준": 각 컨테이너들은 같은 호스트 운영체제 커널을 공유함• "가상화기술": 다양한 컴퓨팅 환경에서 일관되게 실행할 수 있도록 하는 가상 실행 환경• docker, lxc, ... Docker는 현업에서 많이 사용해봤기에... Docker 실습은 생략 컨테이너 오케스트레이션쿠버네티스자동화된 배포 및 관리: 컨테이너생성, 시작, 중지 및 재시작 등의 작업을 자동으로 수행확장 관리: 애플리케이션 부하에 따라 컨테이너 수를 동적으로 조절하여 자원을 효율적으..
파일 시스템
·
CS/운영체제
파일과 디렉터리파일과 디렉터리를 관리하는 커널의 한 부분다양한 파일시스템이 있고 여러 파일 시스템을 동시에 사용할 수 있음파일 (file)- 보조 기억장치의 의미있는 정보의 집합- 구성 요소 - 이름 - 실행하기 위한 정보 - 메타데이터 | 속성 * 많은 운영체제는 디렉터리를 파일과 동일하게 간주한다. 파일 시스템이 만들어지기까지보조기억장치 하나에 단일한파일 시스템이 사용되는 것이 아니다파이셔닝(partitioning): 보조기억장치의 영역을 구획하는 작업파티션(partition): 보조기억장치에서 구획된 영역* 포매팅: 파일 시스템을 만드는 작업 # mkfs -t ext3 /dev/sdb1 (make file system 의 약자) 파일 시스템 종류와 특성[FAT 기반 파일 시스템..
가상 메모리 관리
·
CS/운영체제
페이징과 페이지 테이블스와핑(swapping)프로세스를 보조기억장치의 일부 영역으로 쫓아내고 당장 필요한 프로세스를 적재하는 메모리 관리 기법스왑 아웃(swap-out)프로세스를 보조기억장치의 일부 영역으로 쫓아내는 것스왑 인(swap-in)스왑 아웃된 프로세스를 메모리에 적재하는 것스왑 영역스왑 아웃된 프로세스가 적재되는 보조기억장치 영역 * 연속 메모리 할당. - 이렇게 할당하면 외부 단편화 문제가 발생함. (작업 끝나면 빈 공간이 생기는 메모리 낭비 문제) [Paging]메모리와 프로세스를 일정한 단위로 자르고.그 메모리(Frame)에 프로세스(Page)를 할당한다면 외부 단편화 문제가 안 생김. BUT 페이징을 사용하면. 내부 단편화가 생김.1개의 프로세스당 1개의 페이지 크기보다 작은 메..
동기화와 교착 상태
·
CS/운영체제
프로세스 동기화1. 실행 순서 제어: 프로세스를 올바른 순서로 실행하기2. 상호 배제: 동시에 접근해서는 안되는 자원에 하나만 접근하기 레이스 컨디션(race condition)- 임계 구역을 동시에 설정하여 발생하는 문제. (상호 배제) 생산자와 소비자 문제동기화가 이루어지지 않았을 경우 발생할 수 있는 문제를 보여주는 고전적 문제- producer: 생상을 하는 프로세스(혹은 스레드)- consumer: 소비를 하는 프로세스(혹은 스레드) 뮤텍스와 세마포어뮤텍스 락 (Mutex Lock)- 자물쇠 역할: 프로세스들이 공유하는 전역변수 lock- 자물쇠 잠그기: acquire 함수- 자물쇠 열기: release 함수 (잠겨있는지 계속 확인하는 방법: busy waiting) 세마포(semaphore)-..
CPU 스케줄링
·
CS/운영체제
프로세스 우선순위와 스케줄링 큐운영체제가 공정하고 합리적으로 자원을 배분하는 방법 == 스케줄링 정해진 시간 동안 돌아가면서 CPU를 사용하는 것이 가장 좋나? => NO!프로세스마다 우선순위*가 다르다. ps -el을 통해 우선순위를 볼 수 있음. 우선순위의 차이를 보이는 대표적인 프로세스 유형* I/O bound process > CPU bound processCPU burst, IO burstIO bound process는 잠깐 실행하고 나면 볼 일이 없음. (거의 바로 대기상태) 그래서 우선순위가 높음. 프로세스 우선순위를 토대로 CPU 할당 받는 방법 == CPU 스케줄링 알고리즘 스케줄링 큐 = '줄'자원은 한정되어 있고 실행 중인 프로세스는 여러 개프로세스들의 요구사항을 일목요연하게 관리하는..