본문 바로가기

분류 전체보기34

dplyr - Change Data Type for Column R에서는 데이터프레임을 다루는 주요 패키지 중 하나로 'dplyr' 패키지를 사용할 수 있습니다. 아래 코드는 'dplyr' 패키지를 사용하여 데이터프레임의 열 데이터 유형을 변환합니다. 결과는 데이터프레임의 열 데이터 유형이 각각 integer, numeric, logical로 변환된 것을 보여줍니다. # 필요한 라이브러리 불러오기 library(dplyr) # 샘플 데이터프레임 생성 data 2023. 9. 7.
Pandas - Change Data Type for Column Pandas를 사용하여 데이터프레임의 열 데이터 유형 변환 여기에는 Pandas를 사용하여 데이터프레임의 열 데이터 유형을 변환하는 Python 코드가 포함되어 있으며, 결과는 해당 데이터프레임의 열 데이터 유형이 변환된 것을 보여줍니다. import pandas as pd # 샘플 데이터프레임 생성 data = {'A': ['1', '2', '3'], 'B': [4.1, 5.2, 6.3], 'C': [True, False, True]} df = pd.DataFrame(data) # 데이터 타입이 있는 원본 데이터프레임 출력 print("원본 데이터프레임:") print(df.dtypes) # 'A' 열을 정수로 변환 df['A'] = df['A'].astype(int) # 'B' 열을 부동 소수점으로 .. 2023. 9. 7.
현 미국 대기업 회계 부서에서 진행되는 프로젝트 포츈 500 미국 대기업 내에 회계 부서의 일반적인 문제점 들어가기에 앞서 당부의 말을 하자면, 당연히도 내가 포츈 500에 속한 모든 회사에 다녀본 것은 아니고 단지 다녀본 몇몇 회사의 일반적인 문제점들을 일반화한 것이기 때문에 성급한 일반화의 오류가 존재할 수밖에 없다. 그럼에도 미국 내 대기업들이 시장 점유율을 올리거나 기술 획득을 하기 위해서 인수합병을 전략적으로 많이 하고 있기 때문에 그러한 경우 필연적으로 계승되는 회계상의 문제점들이 있을 수밖에 없다. 가장 큰 골칫거리 중 하나는 서로 다른 ERP 시스템을 쓰는 회사를 인수 합병한 결과 복수의 ERP 시스템을 운영해야 하는 상황이다. 물론 인수합병이 하나로 끝나지 않을 수도 있다. 지금 근무하고 있는 회사의 경우 총 4개의 메이저 ERP가 있.. 2023. 8. 29.
협력을 해야할까 경쟁(견제)을 해야할까? 경쟁자가 등장했다 협력이냐 경쟁이냐 그 선택에 기로에 선 것이다. 오늘 일을 하고 있는데 느닷없이 회사 채팅 (SLACK이 미국에서는 현재 대세이다.) 창에 새로운 인물이 메시지를 보냈다. 이름은 Cesar라고 하는데 이름과 사진을 보니 남미 계열의 친구인 거 같았다. 가볍게 인사를 하니 바로 전화가 걸려왔다. 무엇인가가 필요해서 내 메니져인 Carlos와 대화를 하다가 카를로스가 나를 찾아가 보라고 한 것이다. 물어오는 질문은 생각보다 간단한 것이었는데 아나콘다를 사용한 파이썬 Base 환경 구축이었다. 하지만 회사에서 아나콘다의 다운로드를 잠시 막아버려서 신참인 그는 그것을 다운로드할 수 없었고, 대신에 미니콘다를 사용해서 Base 환경을 만들려고 하는데 해본 적이 없으니 도움을 요청한 것이었다. 기.. 2023. 8. 22.
Business Analyst, Business Analytics, and Business Intelligence 비교분석 Business Analyst, Business Analytics, 그리고 Business Intelligence는 모두 비즈니스 분야에서 데이터와 정보를 활용하는 역할을 수행하는데 관련된 용어입니다. 그러나 각각의 역할과 업무에는 다른 촛점과 특징이 있습니다. Business Analyst (비즈니스 애널리스트): 역할: 비즈니스 애널리스트는 비즈니스 프로세스를 이해하고, 비즈니스 요구사항을 수집하고 분석하여 이를 기술적인 요구사항으로 변환하는 역할을 수행합니다. 비즈니스 프로세스들을 직접 수행하며 보고하며 또 비즈니스 프로세스를 분석하고 개선하는 역할을 수행합니다. 비즈니스 프로세스와 시스템 간의 브릿지 역할을 하며, 비즈니스와 IT 간의 커뮤니케이션을 중재합니다. 촛점: 비즈니스 부서의 엔트리 레벨.. 2023. 8. 20.
비즈니스 애널리틱스 (Business Analytics) 전문가 Business Analytics (비즈니스 애널리틱스) 전문가란? 비즈니스 애널리틱스 전문가는 데이터 분석 기술을 활용하여 과거 데이터를 분석하고 예측 모델링, 패턴 인식, 통계 분석 등을 통해 비즈니스 인사이트를 도출하고 의사결정을 지원하는 전문가입니다. 그들은 데이터를 통해 비즈니스 도메인의 문제를 해결하고 기회를 발견하며, 데이터 시각화와 통계 기술을 활용하여 관련 이해관계자들에게 직관적으로 정보를 전달합니다. 따라서 비즈니스에 대한 전문적인 지식과 함께 높은 수준의 기술이 필요한 직군입니다. 마지막에는 이 직업군에 대한 제 사견이 있으니 끝까지 읽어보시기를 권장드립니다. Business Analytics (비즈니스 애널리틱스) 전문가의 업무 비즈니스 애널리틱스 전문가는 데이터를 분석하여 비즈니스.. 2023. 8. 20.
비즈니스 인텔리전스(Business Intelligence) 전문가 비즈니스 엔텔리전스 전문가란? 비즈니스 인텔리전스 전문가는 조직 내부 및 외부 데이터를 수집, 분석, 가공하여 경영진이나 의사결정자들의 의사결정에 전략적인 통찰력을 제공합니다. BI는 주로 대시보드, 리포팅, 데이터 시각화 등의 업무를 하기 때문에 전문지식 외에도 디지털 파이낸스 툴을 다룰 수 있어야 합니다. 마지막에는 이 직업군에 대한 제 사견이 있으니 끝까지 읽어보시기를 권장드립니다. 비즈니스 엔텔리전스 업무 비즈니스 인텔리전스(Business Intelligence, BI)는 기업이 데이터를 수집, 분석, 시각화하여 의사결정에 활용하는 프로세스와 기술을 의미합니다. BI의 주요 업무는 데이터를 효과적으로 관리하고 분석하여 비즈니스 인사이트를 도출하며, 다양한 비즈니스 전략 및 의사결정에 기여하는 것.. 2023. 8. 19.
Data Handling - Numerical Data Handling Numeric Data (숫자형 데이터 처리)란? 숫자형 데이터를 처리하는 방법은 데이터 전처리 과정 중에서도 중요한 부분입니다. 본문에서는 숫자형 데이터를 다루는 주요 기술과 개념을 설명하겠습니다. 1. 결측값 처리: 결측값은 데이터셋에서 값이 비어 있는 경우를 의미합니다. 이러한 결측값은 분석 및 모델링 작업에서 문제를 일으킬 수 있으므로 적절한 처리가 필요합니다. 주요 결측값 처리 방법에는 평균값, 중앙값, 최빈값으로 채우기, KNN을 이용한 예측 값 채우기, 결측값을 가지고 있는 행 제거 등이 있습니다. 2. 특성 스케일링: 다양한 특성들의 범위 및 단위가 다를 경우, 일부 특성이 모델링에 불리한 영향을 줄 수 있습니다. 따라서 특성을 스케일링하여 같은 범위로 조정하거나 표준화/정.. 2023. 8. 18.
pandas - Joining Datasets 테이블 합병의 종류 데이터 전처리를 하다보면 여러개의 테이블들을 합병해야할 경우가 많습니다. 오늘은 테이블 합병의 종류과 자주 쓰이는 코드들을 하나하나 살펴보도록 하겠습니다. 다음은 관계형 데이터베이스에서 자주 사용되는 테이블 조인의 목록입니다. 모든 종류의 조인을 리스트에 포함시켰으나 자주 쓰이고 꼭 알아두어야 할 것은 노란색으로 강조를 했습니다. 나머지는 몰라도 일하는데 거의 지장이 없습니다. 내부 조인 (Inner Join): 공통 열이나 키를 기반으로 두 개 이상의 테이블의 행을 결합합니다. 일치하는 행만 결과에 포함됩니다. 왼쪽 외부 조인 (Left Outer Join): 왼쪽 (첫 번째) 테이블의 모든 행과 오른쪽 (두 번째) 테이블의 일치하는 행을 포함합니다. 오른쪽 테이블에서 일치하는 값이.. 2023. 8. 16.