이 예제에서는 테이블의 변수를 텍스트에서 categorical형 배열로 변환하는 방법을 보여줍니다.
이 워크플로는 string형 배열인 테이블 변수와 문자형 벡터로 구성된 셀형 배열인 변수에 동일하게 적용됩니다.
1) 샘플 데이터 불러오기 및 테이블 생성
100명의 환자로부터 수집한 샘플 데이터를 불러옵니다.
Age, Height, Weight, SelfAssessedHealthStatus, Location의 환자 데이터를 테이블에 저장합니다.
변수 LastName의 고유한 식별자를 행 이름으로 사용합니다.
셀형 배열인 변수를 string형 배열로 변환하려면 convertvars 함수를 사용하십시오.
2) 텍스트에서 categorical형 배열로 테이블 변수를 변환하기
변수 Location과 SelfAssessedHealthStatus는 고유한 값으로 구성된 이산 집합을 포함합니다.
변수에 위치나 상태 같이 범주로 간주될 수 있는 값 집합이 포함된 경우 그 값을 categorical형 변수로 변환해 보십시오.
Location을 categorical 함수를 통해 categorical형 배열로 변환합니다.
변수 SelfAssessedHealthStatus는 4개의 고유한 값 Excellent, Fair, Good, Poor를 포함합니다.
범주에 수학적 정렬(Mathematical Ordering) Poor < Fair < Good < Excellent가 적용되는
순서형 categorical형 배열로 SelfAssessedHealthStatus를 변환합니다.
3) 요약 출력하기
테이블을 요약하는 summary를 사용하여 각 변수에 대한 데이터형, 설명, 단위 및 기타 기술 통계량을 확인합니다.
테이블 변수 SelfAssessedHealthStatus와 Location은 categorical형 배열입니다.
요약에는 각 범주에 포함된 요소의 개수가 포함됩니다.
예를 들어, 요약에 100명의 환자 중 11명이 자신의 건강을 Poor로 평가하고 34명이 Excellent로 평가했음이 표시됩니다.
4) 범주를 기반으로 하여 데이터 선택
County General Hospital에서 관찰한 환자 중 자신의 건강을 Excellent로 평가한 모든 환자의
연령, 키, 체중을 포함하는 하위 테이블 T1을 생성합니다.
categorical형 배열 Location과 SelfAssessedHealthStatus에 포함된 값을 기반으로 하여
논리형 벡터를 손쉽게 생성할 수 있습니다.
rows는 위치가 County General Hospital이고 환자가 자신의 건강을 Excellent로 평가한 테이블 행에 대해
논리값 true(1)를 가지는 100×1 논리형 벡터입니다.
변수의 서브셋을 정의합니다.
괄호를 사용하여 하위 테이블 T1을 생성합니다.
순서형 categorical형 배열의 범주에는 수학적 정렬이 적용되어 있으므로
보다 큼 및 보다 작음과 같은 관계 연산을 사용하여 문자열에 대해 요소별 비교를 수행할 수 있습니다.
'Poor' 또는 'Fair'와 같이 건강 상태를 평가한 모든 환자의 연령, 키, 체중으로 구성된 하위 테이블 T2를 생성합니다.
먼저, 테이블 T2에 포함시킬 행의 서브셋을 정의합니다.
그런 다음, 테이블 T2에 포함시킬 변수의 서브셋을 정의합니다.
괄호를 사용하여 하위 테이블 T2를 생성합니다.