'Language/Python' 카테고리의 글 목록

728x90

Python 생태계에서 패키지 관리와 가상환경 설정은 필수입니다. 그동안 pipenv, poetry와 같은 도구들이 널리 쓰였지만, 최근엔 극강의 속도와 단순함을 자랑하는 새로운 패키지 매니저 uv가 주목받고 있습니다.

Python 패키지 매니저 비교: pipenv, poetry, uv

기능 / 도구	pipenv	poetry	uv (by Astral)
가상환경 관리	내장 (자동 생성)	내장 (PEP 582 미지원)	내장 (자동 venv 생성 및 활성화)
설치 속도	느림	보통	매우 빠름 (Rust 기반)
의존성 해결	pipfile.lock 기반	pyproject.toml + poetry.lock 사용	pyproject.toml, uv.lock 지원
lockfile 지원	✅	✅	✅
CLI 편의성	제한적 (pip + virtualenv wrapper)	직관적, 다양한 명령어 지원	심플한 CLI (uv pip, uv venv 등)
커뮤니티 및 안정성	오래된 프로젝트, 유지 보수 적음	성숙한 프로젝트, 인기 많음	신생 도구, 빠르게 성장 중

실사용 후기 (개인 기준)

pipenv : 작은 프로젝트에선 문제없지만, 복잡한 의존성에서는 종종 충돌 발생. 속도도 느림.
poetry : 문법도 직관적이고, 대규모 프로젝트에 적합. 다만, 설치 속도가 아쉽고 느릴 때가 있음.
uv : 설치 속도와 가벼움은 진짜 최고. Rust 기반이라 poetry보다 훨씬 빠르고, pip 대비 의존성 해결도 안정적.

결론: 속도와 간결함이 필요한 경우 uv가 최적. 대규모 프로젝트에서 신뢰성과 커뮤니티를 원한다면 poetry.

💻 macOS에 uv 설치하기 (with Homebrew)

1. 설치 명령어

brew install uv

2. 설치 확인

uv --version

⚙️ uv 기본 사용법

uv는 poetry 와 비슷하게 잠금 파일, 작업 공간 등을 지원하여 프로젝트 종속성과 환경을 관리합니다.

uv init 명령을 사용하여 새로운 Python 프로젝트를 만들 수 있습니다.

uv init uv-test
cd uv-test

uv는 다음 파일을 생성하며, 기본적인 파이썬 프로젝트 구조를 생성하게 됩니다.

.
├── .git
├── .gitignore
├── .python-version
├── main.py
├── pyproject.toml
└── README.md

main.py 파일에는 간단한 "Hello world" 프로그램이 포함되어 있습니다. uv run 명령어로 실행합니다.

uv run main.py

(결과)
Creating virtual environment at: .venv
Hello from uv-test!

uv run 을 실행하면, 프로젝트 내부에 파이썬 가상환경 .venv 가 자동으로 생성되며, 파이썬 프로그램이 실행됩니다.

📦 프로젝트 예시 구조

.
├── .git
├── .gitignore
├── .python-version
├── .venv
├── main.py
├── pyproject.toml
├── README.md
└── uv.lock

pyproject.toml 에는 poetry의 종속성 관리와 같이 프로젝트에 대한 메타데이터가 포함되어 있습니다.
pyproject.toml 을 사용하여 종속성은 물론, 프로젝트 설명이나 라이선스와 같은 세부 정보를 관리할 수 있고, uv add 및 uv remove 명령을 사용하여 프로젝트를 관리할 수 있습니다.

🚀 마무리하며

Python의 패키지 관리 도구는 점점 더 다양해지고 있습니다. uv는 빠른 설치, 심플한 CLI, 강력한 의존성 해결을 통해 새로운 대안으로 부상하고 있습니다.
특히, poetry가 제공하는 워크플로우를 그대로 가져오면서도 훨씬 가볍고 빠르기 때문에, 개발 속도와 효율을 중요하게 여기는 개발자라면 꼭 한번 경험해보길 추천합니다.

Reference

https://docs.astral.sh/uv/guides/projects/

728x90

저작자표시 비영리 변경금지 (새창열림)

'Language > Python' 카테고리의 다른 글

(Python) Poetry - 패키지 관리 도구 (0)	2025.01.10
(Python) Python Dotenv을 사용하여 환경 변수 관리하기 (0)	2024.06.23
(Python) Streamlit Docker로 실행하기 (0)	2024.03.03
(Python) Streamlit 기본 (0)	2024.03.03
PDF to Excel in Python (2)	2024.01.28

728x90

Poetry

Poetry는 Python 프로젝트의 의존성 관리 및 패키지 관리를 위한 보다 현대적이고 강력한 도구입니다. pyproject.toml 파일을 사용하여 설정과 의존성을 관리합니다.

주요기능

장점:

강력한 의존성 해결: Poetry는 pyproject.toml 을 사용하여 의존성 해결과 관리에서 매우 효율적이고, 복잡한 의존성 충돌을 잘 해결합니다.
- 이는 PEP 518 표준에 따라 Python 패키지의 구성을 정의하는 방법으로, 향후 여러 도구와의 호환성을 고려한 설정 방식입니다.
통합된 패키지 관리: 패키지 배포와 버전 관리를 한 번에 할 수 있습니다. publish 명령어로 직접 PyPI에 패키지를 배포할 수 있어 편리합니다.
자동화된 패키지 빌드: 프로젝트 빌드 과정에서 필요한 모든 파일과 의존성을 자동으로 생성하여 배포할 수 있습니다.

단점:

• 학습 곡선: Pipenv보다는 좀 더 많은 기능을 제공하지만, 그만큼 학습 곡선이 존재합니다.

• 호환성 문제: 일부 오래된 패키지나 라이브러리와의 호환성 문제를 겪을 수 있습니다.

설치방법

System requirements

Python 3.9 이상
Linux, macOS, Windows 지원

Installation

MacOS

1️⃣ poetry가 설치 되어 있지 않은 경우, 설치 합니다.

brew install poetry

2️⃣ 프로젝트 생성 (pyproject.toml)

poetry는 패키지관리를 위한 pyproject.toml 생성 부터 시작합니다.

① poetry init

패키지 생성을 위한 기본 정보를 대화형 기반으로 pyproject.toml 파일을 만들 수 있습니다.

poetry init

Options

--name: Name of the package.
--description: Description of the package.
--author: Author of the package.
--python Compatible Python versions.
--dependency: Package to require with a version constraint. Should be in format foo:1.0.0.
--dev-dependency: Development requirements, see --dependency.

② poetry new

Python 프로젝트에 적합한 디렉토리 구조를 만들어서 생성합니다.

poetry new <프로젝트 이름>

as follows:

my-package
├── pyproject.toml
├── README.md
├── my_package
│   └── __init__.py
└── tests
    └── __init__.py

3️⃣ 패키지 관리

① 패키지 추가

poetry add <패키지명>

개발 의존성으로 패키지를 추가하고자 한다면, --dev 플래그 사용

poetry add --dev <패키지명>

② 패키지 삭제

poetry remove <패키지명>

③ 패키지 조회

poetry show

poetry show --tree # 의존성 트리

poetry show --latest # 최신 버전도 함께 표시

poetry show --outdated # 업데이트가 가능한 패키지의 목록 표시

poetry show --no-dev # 개발 의존성을 제외하고 표시

4️⃣ 가상환경 생성 및 활성화

poetry env activate

Poetry 2.0 업데이트에 따른 주요 변경사항

poetry export:

Poetry 1.2 버전부터 poetry export 명령은 이제 기본 기능이 아니라 플러그인으로 제공됩니다.
poetry export를 사용하려면 poetry-plugin-export 플러그인을 별도로 설치해야 합니다.

poetry shell:

poetry shell 명령어도 더 이상 Poetry의 기본 명령어로 제공되지 않습니다.
새로운 명령어인 poetry env activate를 사용하여 가상환경 활성화를 해야합니다.
poetry shell 명령어를 사용하고 싶다면, poetry-plugin-shell 플러그인을 설치하여 사용할 수 있습니다.

Reference

Poetry
pipx

728x90

저작자표시 비영리 변경금지 (새창열림)

'Language > Python' 카테고리의 다른 글

(Python)⚡️ 차세대 Python 패키지 매니저 uv (0)	2025.04.17
(Python) Python Dotenv을 사용하여 환경 변수 관리하기 (0)	2024.06.23
(Python) Streamlit Docker로 실행하기 (0)	2024.03.03
(Python) Streamlit 기본 (0)	2024.03.03
PDF to Excel in Python (2)	2024.01.28

728x90

Python 애플리케이션을 개발할 때, 환경 변수를 사용하는 것은 매우 중요한 부분입니다. API 키, 데이터베이스 접속 정보와 같은 민감한 데이터를 코드에 직접 코딩하지 않고 환경 변수로 관리하는 것이 좋습니다. 이번 블로그에서는 python-dotenv 라이브러리를 사용하여 Python 환경 변수를 관리하는 방법에 대해 알아보겠습니다.

1. Python Dotenv 설치하기

먼저, python-dotenv 라이브러리를 설치 합니다. 이 라이브러리는 .env 파일에 저장된 환경 변수를 읽어 Python 애플리케이션에서 사용할 수 있도록 해줍니다.

# pipenv
pipenv install python-dotenv

2. .env 파일 생성하기

프로젝트 루트 디렉토리에 .env 파일을 생성합니다. 이 파일에는 환경 변수와 그 값을 키=값 형식으로 작성합니다.
.env 파일에는 민감한 정보가 포함될 수 있으므로, .gitignore 파일을 생성하고 .env 파일을 추가하여 github 등에 포함되지 않도록 하여 줍니다.

SECRET_KEY=mysecretkey  
DATABASE_URL=postgres://user:password@localhost/db  
API_KEY="your-api-key"

3. 환경 변수 로드하기

이제 Python 코드에서 python-dotenv을 사용하여 .env 파일에 정의된 환경 변수를 로드할 수 있습니다. 이를 위해 dotenv 모듈의 load_dotenv 함수를 사용합니다.

import os  
from dotenv import load_dotenv  

# Load environment variables from the .env file (if present)  
load_dotenv()  

# Access environment variables as if they came from the actual environment  
SECRET_KEY = os.getenv('SECRET_KEY')  
DATABASE_URL = os.getenv('DATABASE_URL')  
API_KEY = os.getenv('API_KEY')  

# Example usage  
print(f'SECRET_KEY: {SECRET_KEY}')  
print(f'DATABASE_URL: {DATABASE_URL}')  
print(f'API_KEY: {API_KEY}')

결과

SECRET_KEY: mysecretkey
DATABASE_URL: postgres://user:password@localhost/db
API_KEY: your-api-key

결론

python-dotenv 라이브러리를 사용하면 환경 변수를 쉽게 관리하고 애플리케이션 설정을 안전하게 유지할 수 있습니다. 이 방법을 통해 코드 내에 민감한 정보를 반영 하지 않고, 다양한 환경에서 동일한 코드를 사용할 수 있습니다. python-dotenv을 사용하여 환경 변수를 효율적으로 관리해보시기 바랍니다.

728x90

저작자표시 비영리 변경금지 (새창열림)

'Language > Python' 카테고리의 다른 글

(Python)⚡️ 차세대 Python 패키지 매니저 uv (0)	2025.04.17
(Python) Poetry - 패키지 관리 도구 (0)	2025.01.10
(Python) Streamlit Docker로 실행하기 (0)	2024.03.03
(Python) Streamlit 기본 (0)	2024.03.03
PDF to Excel in Python (2)	2024.01.28

728x90

Streamlit App Dockerize

Streamlit App은 다양한 클라우드 플랫폼(AWS, GCP, Google 등)에 배포가 가능하며, 앱을 컨테이너화 하여 여러 클라우드 플랫폼에 배포할 수 있다.

Prerequisites

실행할 App을 다운로드 합니다.
소스는 Streamlit에서 제공하는 샘플 Repository를 활용합니다.

git clone https://github.com/streamlit/streamlit-example.git .

Dockerfile 만들기

# Base 이미지
FROM python:3.12-slim

# 2. 작업 디렉토리를 /app으로 설정
WORKDIR /app

# 3. 현재 디렉토리의 requirements.txt 파일을 컨테이너의 /app으로 복사
COPY requirements.txt /app/

# 4. requirements.txt에 명시된 패키지 설치
RUN pip3 install -r requirements.txt

# 5. 실행할 streamlit_app.py를 컨테이너 /app으로 복사
COPY streamlit_app.py /app/

# 6. 컨테이너가 수신할 포트 오픈
EXPOSE 8501

# 7. 컨테이너 헬스 체크
HEALTHCHECK CMD curl --fail http://localhost:8501/_stcore/health

#8. 실행될 컨테이너 구성
ENTRYPOINT [ "streamlit", "run", "streamlit_app.py", "--server.port=8501", "--server.address=0.0.0.0" ]

Streamlit 버전 1.10.0 이상에서는 Streamlit 앱을 Linux 배포판의 루트 디렉터리에서 실행할 수 없습니다. 따라서 WORKDIR은 루트가 아닌 별도 디렉토리를지정해야 합니다. (예. /app)
(참고) github Issue:5239

Docker image 빌드

생성한 Dockerfile 을 streamlit 이미지 이름으로 빌드합니다.

docker build -t streamlit .

docker images 로 생성된 이미지 를 확인합니다.

REPOSITORY  TAG       IMAGE ID       CREATED         SIZE
streamlit   latest    bb9ac485406e   2 minutes ago   634MB

Docker 컨테이너 실행

컨테이너의 포트 8501을 서버의 8501 포트에 게시합니다.

docker run -p 8501:8501 streamlit

출력된 URL로 접속합니다.

Collecting usage statistics. To deactivate, set browser.gatherUsageStats to False.

  You can now view your Streamlit app in your browser.

  URL: http://0.0.0.0:8501

(결과)

Reference

https://docs.streamlit.io/knowledge-base/tutorials/deploy/docker#dockerfile-walkthrough

728x90

저작자표시 비영리 변경금지 (새창열림)

'Language > Python' 카테고리의 다른 글

(Python) Poetry - 패키지 관리 도구 (0)	2025.01.10
(Python) Python Dotenv을 사용하여 환경 변수 관리하기 (0)	2024.06.23
(Python) Streamlit 기본 (0)	2024.03.03
PDF to Excel in Python (2)	2024.01.28
Anaconda 가상환경 Window에서 Linux로 옮기기 (0)	2022.06.12

728x90

Streamlit

Streamlit은 데이터 애플리케이션을 빠르고 쉽게 만들 수 있도록 설계된 파이썬 기반의 오픈 소스 라이브러리입니다. 이 도구는 데이터 시각화와 머신 러닝 모델의 프로토타이핑 및 배포를 단순화하여 사용자가 복잡한 데이터 작업을 쉽게 수행할 수 있게 합니다.

Streamlit의 특징

코드 중심의 접근 방식: Streamlit 애플리케이션은 순수 파이썬 코드로 작성되므로 별도의 웹 프론트엔드 기술 없이도 데이터 앱을 만들 수 있습니다.
간편한 사용법: 몇 줄의 코드만으로도 인터랙티브한 요소(슬라이더, 버튼, 차트 등)를 추가할 수 있으며, 앱의 업데이트와 실행이 매우 빠릅니다.
빠른 프로토타이핑: 데이터 과학 프로젝트의 초기 아이디어를 빠르게 시각화하고 공유할 수 있어 프로토타이핑과 반복 개발 과정이 용이합니다.
확장성: Streamlit 앱은 컨테이너화하여 쉽게 배포할 수 있고, 다양한 데이터 소스와 라이브러리를 지원합니다.

장점

빠른 개발 속도: 복잡한 웹 앱을 빠르게 개발할 수 있으며, 데이터 과학자가 웹 개발에 대한 깊은 지식 없이도 사용할 수 있습니다.
쉬운 배포: Streamlit Sharing을 통해 GitHub에서 직접 앱을 호스팅하고 공유할 수 있습니다.
강력한 커뮤니티 지원: 오픈 소스 프로젝트로서 활발한 커뮤니티 지원과 지속적인 업데이트가 이루어집니다.
인터랙티비티: 사용자 입력에 반응하는 동적인 데이터 애플리케이션을 쉽게 만들 수 있습니다.

단점

고급 사용자 정의 제한: Streamlit은 사용의 용이성에 중점을 두기 때문에, 복잡한 사용자 인터페이스나 고도로 맞춤화된 앱 디자인을 구현하기 어려울 수 있습니다.
성능 문제: 대규모 데이터셋이나 복잡한 연산을 처리하는 앱의 경우, 성능 저하가 발생할 수 있습니다.
웹 개발 기능의 제한: 전통적인 웹 개발 툴셋에 비해 제공하는 웹 개발 기능이 제한적일 수 있습니다. 복잡한 웹 애플리케이션을 구축하려는 경우 다른 프레임워크를 고려해야 할 수도 있습니다.

Streamlit App 실행하기

# streamlit 라이브러리설치
pip install streamlit

# Streamlit으로 실행
streamlit run your_script.py

# Python 모듈로 실행 → Python으로 실행하는 경우, PyCharm과 같은 IDE를 구성할 때 유용할 수 있습니다.
python -m streamlit run your_script.py

Data 표시방법

Streamlit에서 Data (tables, arrays, data frames 등)를 표시하는 방법은 magic CLI 와 st.write() 를 활용하는 방법이 있다.
st.write()는 텍스트에서 테이블까지 다 작성이 가능하다.

① magic command line

Streamlit은 변수나 데이터가 선언되어 있으면 자동으로 st.write()를 사용하여 앱을 빌드 합니다.

###
# first app
# DataFrame 으로 테이블을 생성
###

import streamlit as st
import pandas as pd

df = pd.DataFrame({
    'first column': [1, 2, 3, 4],
    'second column': [10, 20,30, 40]
})

df

② st.write()

st.write()는 텍스트, 데이터, 차트 등 arguments 에 따라 작성 할 수 있다.

import streamlit as st
import pandas as pd

st.write("Here's our first attempt at using data to create a table:")
st.write(pd.DataFrame({
    'first column': [1, 2, 3, 4],
    'second column': [10, 20,30, 40]
}))

데이터를 표시하는 데 사용할 수 있는 st.dataframe() 및 st.table()과 같은 함수를 사용하여 다양한 style을 적용 할 수 있다.

DataFrame에 Style 적용하기

① DataFrame에 Highligt 적용

import streamlit as st
import pandas as pd
import numpy as np

df = pd.DataFrame(
    np.random.randn(10, 20),    # 표준 정규분포 확률을 따르는 난수를 생성
    columns = ('col %d' % i for i in range(20))
)

# 열의 최대값에 하이라이트 표시
st.dataframe(df.style.highlight_max(axis=0))

(결과)

② 정적 테이블 생성 : st.table()

import streamlit as st
import pandas as pd
import numpy as np

df = pd.DataFrame(
    np.random.randn(10, 20),    # 표준 정규분포 확률을 따르는 난수를 생성
    columns = ('col %d' % i for i in range(20))
)

st.table(df)

③ 라인 차트 그리기 : st.line_chart()

import streamlit as st
import pandas as pd
import numpy as np

df = pd.DataFrame(
    np.random.randn(20, 3),    # 표준 정규분포 확률을 따르는 난수를 생성
    columns = ['a', 'b', 'c']
)

st.line_chart(df)

(결과)

⓸ 지도 그리기 : `st.map()`

Numpy를 사용하여 샘플 데이터를 생성하고 샌프란시스코 지도에 그려보겠습니다.

import streamlit as st
import pandas as pd
import numpy as np

df = pd.DataFrame(
    np.random.randn(1000, 2) / [50, 50] + [37.76, -122.4],
    columns=['lat', 'lon']
)

st.map(df)

(결과)

⑤ Widgets

st.slider(), st.button() , st.selectbox() 와 같이 위젯을 추가하여 표현할 수있다.

import streamlit as st
import pandas as pd
import numpy as np

st.markdown("### 1. slider widget")
x = st.slider('x')
st.write(x, '제곱은', x * x)


st.markdown("### 2. text input widget")
st.text_input("Your name", key="name")

# You can access the value at any point with:
st.session_state.name

st.markdown("### 3. checkbox widget")
if st.checkbox('Once you checked, dataframe is displyed'):
    chart_data = pd.DataFrame(
       np.random.randn(20, 3),
       columns=['a', 'b', 'c'])

    chart_data

st.markdown("### 4. selectbox widget")
df = pd.DataFrame({
    'first column': [1, 2, 3, 4],
    'second column': [10, 20, 30, 40]
    })

option = st.selectbox(
    'Which number do you like best?',
     df['first column'])

'You selected: ', option

⓺ Layout

st.sidebar : 왼쪽 패널 사이드바
st.columns : 위젯을 나란히 구성
st.expander : 컨텐츠 숨김
st.progress : 상태 표시

import streamlit as st
import time

# 사이드바에 selctbox 구성하기
add_selectbox = st.sidebar.selectbox(
    'How would you like to be contacted?',
    ('Email', 'Home phone', 'Mobile phone')
)

# 사이드바에 slide 구성하기
add_slider = st.sidebar.slider(
    'Select a range of values',
    0.0, 100.0, (25.0, 75.0)
)

# 위젯을 나란히 배치하기
left_column, right_column = st.columns(2)
left_column.title('Left Column')
left_column.button('Press me')

right_column.title('Right Column')
with right_column:
    chosen = st.radio(
        'Sorting hat',
        ("Gryffindor", "Ravenclaw", "Hufflepuff", "Slytherin")
    )
    st.write(f"You are in {chosen} house!")

# Progress Bar
st.title('Progress Bar')
'Starting a long computation...'
latest_iteration = st.empty()
bar = st.progress(0)

for i in range(100):
    latest_iteration.text(f'Iteration {i+1}')
    bar.progress(i+1)
    time.sleep(0.1)

'...and now we\'re done!'

멀티페이지 App 만들기

Streamlit 1.10 이상 부터는 멀티 페이지를 구성할 수 있습니다.

서브페이지 구성 제약

Sub 페이지의 기본 구성은 pages 디렉토리에 위치해야 합니다.
각 Streamlit 앱의 이름은 파일 이름에 따라 결정되므로 앱 이름을 변경하려면 파일 이름을 변경해야 합니다. (이모티콘 추가도 가능)
각 Python 파일의 시작 부분에 숫자를 추가하여 페이지 순서를 지정할 수 있습니다. 파일 이름 앞에 1을 추가하면 Streamlit은 해당 파일을 목록의 첫 번째로 배치합니다.
각 페이지에는 파일 이름으로 정의된 고유한 URL이 있습니다.

멀티페이지 구성

멀티페이지는 메인이 되는 Home.py 와 내부의 1_page_one.py, 2_Page_two.py, 3_🥉_three.py 3개의 서브페이지로 이동 되도록 구성합니다.

페이스 구성 소스트리

Home.py     # "streamlit run"으로 실행할 메인 파일
└─── pages/
    └─── 1_page_one.py 
    └─── 2_Page_two.py 
    └─── 3_🥉_three.py

① 기본 사이드바 탐색 숨기기

파일명을 기준으로 사이드바 메뉴를 별도 이름으로 지정할 수 있도록 변경합니다.
사용자 정의 탐색 메뉴를 생성할 때 를 사용하여 기본 사이드바 탐색을 숨겨야 합니다. 소스코드 루트 .streamlit/config.toml작업 디렉터리에 다음 파일을 추가합니다 .

[client]
showSidebarNavigation = false

② 사이드 바 메뉴 구성하기

메뉴트리 구성을 위해서는 각 Page 별로 메뉴를 동일하게 구성합니다.

# 공통 사이드바
st.sidebar.page_link("home.py", label="Home")
st.sidebar.page_link("pages/1_page_one.py", label="🥇 Page One")
st.sidebar.page_link("pages/2_Page_two.py", label="🥈 Page Two")
st.sidebar.page_link("pages/3_🥉_three.py", label="🥉 Page Three")
st.sidebar.markdown("---")

(결과)

Reference

728x90

저작자표시 비영리 변경금지 (새창열림)

'Language > Python' 카테고리의 다른 글

(Python) Python Dotenv을 사용하여 환경 변수 관리하기 (0)	2024.06.23
(Python) Streamlit Docker로 실행하기 (0)	2024.03.03
PDF to Excel in Python (2)	2024.01.28
Anaconda 가상환경 Window에서 Linux로 옮기기 (0)	2022.06.12
PowerShell Anaconda 설정하기 (0)	2022.03.01

728x90

파이썬에서 PDF 파일을 읽어와서 엑셀 파일로 변환하기 위해서는 몇 가지 라이브러리를 사용해야 합니다.
주로 PyPDF2 또는 pdfplumber를 사용하여 PDF 파일을 읽고, pandas를 사용하여 데이터를 가공하여 엑셀 파일로 저장할 수 있습니다.

pdfplumber 는 PDF 파일의 각 문자, 사각형, 선에 대한 상세한 정보를 제공하고 텍스트와 표를 쉽게 추출할 수 있는 라이브러리로, 데이터 분석 및 자동화 작업에 유용한 도구입니다.

https://github.com/jsvine/pdfplumber

1. 라이브러리 설치

먼저 pdfplumber 라이브러리를 설치합니다.(pip, anaconda, pipenv 환경 구성에 따라 설치 합니다.)

1. pip
pip install pdfplumber

2. anaconda
conda install -c conda-forge pdfplumber

3. pipenv
pipenv install pdfplumber

2. 테이블 추출하기

pdf 를 추출하기 위해 pdfplumber.open(file) 함수를 이용하여 pdf를 추출합니다.

import os  
import pdfplumber  
import pandas as pd  


file_path = os.getcwd()+"/contents/"  
pdf_name = "file.pdf"  
pdf_file_path = file_path + pdf_name  

# PDF 파일 열기  
pdf = pdfplumber.open(pdf_file_path)  

pages = pdf.pages  
print("총 페이지 수 : ", len(pages))  

tables = []  

# 1. 페이지에서 표 데이터 추출하기  
for each in pages:  
    table = each.extract_tables()  
    tables.extend(table)

3. 데이터 프레임으로 변환

# 2. 데이터 프레임으로 변환  
df = pd.DataFrame(tables[1:], columns=[tables[0]])  

# 3. 데이터프레임을 엑셀 파일로 저장  
excel_file_path = file_path + "file.xlsx"  
df.to_excel(excel_file_path, index=False, engine='openpyxl')

print(f'DataFrame이 {excel_file_path}에 저장 되었습니다.')

※ openpyxl 라이브러리가 설치되어 있지 않은 경우, 설치 하여 주세요.

728x90

저작자표시 비영리 변경금지 (새창열림)

'Language > Python' 카테고리의 다른 글

(Python) Streamlit Docker로 실행하기 (0)	2024.03.03
(Python) Streamlit 기본 (0)	2024.03.03
Anaconda 가상환경 Window에서 Linux로 옮기기 (0)	2022.06.12
PowerShell Anaconda 설정하기 (0)	2022.03.01
파이썬 시작하기(3) - Pycharm 설치(Professional 버전) (0)	2021.09.10

728x90

Window에 설치된 Python 가상환경을 Linux로 옮겨보겠습니다.

Anaconda 가상환경은 운영체제끼리는 같아야 yml 기반으로 가상환경 생성 과정에서 에러가 생기지 않습니다.

일부 OS 플랫폼에서는 사용할 수 없는 패키지가 있습니다.
- Linux에서만 사용할 수 있는 패키지와 Windows에서만 사용할 수 있는 패키지가 있어 빌드버전은 OS에 따라 다를 수 있습니다.

Conda does not check architecture or dependencies when installing from a spec file. To ensure that the packages work correctly, make sure that the file was created from a working environment, and use it on the same architecture, operating system, and platform, such as linux-64 or osx-64.

1. 가상환경 Export

빌드 버전의 OS종속성을 제거하기 위해 --no-build 옵션을 사용하여 가상환경을 추출합니다.

conda env export -n "가상환경이름" --no-build > envrionment.yml

2. 가상환경 생성

Linux 환경에서 Anaconda 가상환경을 생성합니다.

conda create -n "가상환경이름" python=3.9

3. 가상환경 업데이트

생성한 가상환경을 추출한 environment.yml로 업데이트 해줍니다.

conda env update -n "가상환경 이름" -f environment.yml

가상환경 업데이트를 하면 다음과 같이 찾을 수 없는 패키지가 확인 됩니다.

Output:

Solving environment: failed

ResolvePackageNotFound:
  - vs2015_runtime=14.27.29016
  - wincertstore=0.2
  - vc=14.2

해당 항목들을 anaconda 패키지 리스트에 확이하면, 다음과 같이 Window OS 종속된 항목으로 Linux에 지원되지 않는 패키지 임을 확인 할 수 있습니다.

window에만 설치 가능한 패키지를 삭제하고 다시 가상환경을 업데이트 합니다.

conda env update -n "가상환경 이름" -f environment.yml

Reference

728x90

'Language > Python' 카테고리의 다른 글

(Python) Streamlit 기본 (0)	2024.03.03
PDF to Excel in Python (2)	2024.01.28
PowerShell Anaconda 설정하기 (0)	2022.03.01
파이썬 시작하기(3) - Pycharm 설치(Professional 버전) (0)	2021.09.10
파이썬 시작하기(2) - Anaconda 가상환경 생성 (0)	2021.09.09

728x90

Window 환경의 CMD(명령 프롬프트)에서는 conda 명령어가 잘 동작하지만 powershell에서는 명령어가 동작하지 않는 문제가 있습니다.

아래와 같이 하면 PowerShell에서도 사용할 수 있습니다.

1. init powershell in Conda

# 1. ****init powershell in Conda****
conda init powershell

# 2. 현재 설정된 정책을 확인
Get-ExecutionPolicy

# Result
PS C:\WINDOWS\system32> Get-ExecutionPolicy
ByPass

2. 실행 정책 변경

아래 명령어로 정책을 변경합니다.

Set-ExecutionPolicy -ExecutionPolicy Unrestricted

Get-ExecutionPolicy 으로 Unrestricted 결과가 나오면 정책이 변경이 완료됩니다.

3. Restart Powershell

기타

PowerShll에서 (base) 를 지우고 싶은 경우,

conda config --set auto_activate_base false

PowerShll에서 (base) 를 나타나게 하고 싶은 경우,

conda config --set auto_activate_base true

728x90

'Language > Python' 카테고리의 다른 글

PDF to Excel in Python (2)	2024.01.28
Anaconda 가상환경 Window에서 Linux로 옮기기 (0)	2022.06.12
파이썬 시작하기(3) - Pycharm 설치(Professional 버전) (0)	2021.09.10
파이썬 시작하기(2) - Anaconda 가상환경 생성 (0)	2021.09.09
파이썬 시작하기(1) - Anaconda 설치 (2)	2021.09.08

728x90

과학용으로 국한되어 사용되고 있던 python의 발전으로 웹개발까지 여러 방면으로 활용되고 있습니다.
python IDE Tool로 가장 많이 활용되고 있는 Tool 중 하나는 Pycharm 입니다.

1. Pycharm 다운로드

pycharm은 무료버전인 community버전과, 유료인 Professional 버전이 있습니다.

Professional 버전을 다운로드 받습니다. 🌴Pycharm 다운로드

2. Pycharm 설치

설치 마법사에 따라 설치를 진행합니다. Next 를 클릭합니다.

설치 파일 경로를 지정하고 Next 를 클릭합니다.

옵션 값들은 모두 선택하고 Next 를 클릭합니다.

윈도우 시작메뉴 등록하고 Install 을 진행합니다.

모든 설치가 끝나면 윈도우를 재시작 합니다.

3. 라이선스 인증

Pycharm을 실행하고, 구매한 라이선스 인증 코드를 넣으면 설치가 완료됩니다.

4. Pycharm 컴파일 설정(Interpreter)

Setting 메뉴에서 Python Interpreter를 선택합니다.

Anaconda로 설정한 가상환경을 Interpreter로 설정합니다.
생성된 가상환경은 설치된 Anaconda폴더의 envs 폴더에 있습니다.

[참고] Anaconda Python 가상 환경 생성 하기

설정이 완료되면 Interpreter화면 가상환경으로 생성한 패키지 목록을 확인할 수 있습니다.

728x90

'Language > Python' 카테고리의 다른 글

Anaconda 가상환경 Window에서 Linux로 옮기기 (0)	2022.06.12
PowerShell Anaconda 설정하기 (0)	2022.03.01
파이썬 시작하기(2) - Anaconda 가상환경 생성 (0)	2021.09.09
파이썬 시작하기(1) - Anaconda 설치 (2)	2021.09.08
Python 개발 환경 구축하기 - 파이썬 설치(Windows 10) (0)	2021.08.22

Language/Python

💻 macOS에 uv 설치하기 (with Homebrew)

⚙️ uv 기본 사용법

🚀 마무리하며

Reference

'Language > Python' 카테고리의 다른 글

Poetry

주요기능

설치방법

System requirements

Installation

Poetry 2.0 업데이트에 따른 주요 변경사항

Reference

'Language > Python' 카테고리의 다른 글

1. Python Dotenv 설치하기

2. .env 파일 생성하기

3. 환경 변수 로드하기

결론

'Language > Python' 카테고리의 다른 글

Streamlit App Dockerize

Prerequisites

Dockerfile 만들기

Docker image 빌드

Docker 컨테이너 실행

Reference

'Language > Python' 카테고리의 다른 글

Streamlit

Streamlit의 특징

장점

단점

Streamlit App 실행하기

Data 표시방법

① magic command line

② st.write()

DataFrame에 Style 적용하기

① DataFrame에 Highligt 적용

② 정적 테이블 생성 : st.table()

③ 라인 차트 그리기 : st.line_chart()

⓸ 지도 그리기 : st.map()

⑤ Widgets

⓺ Layout

멀티페이지 App 만들기

서브페이지 구성 제약

멀티페이지 구성

① 기본 사이드바 탐색 숨기기

② 사이드 바 메뉴 구성하기

Reference

'Language > Python' 카테고리의 다른 글

1. 라이브러리 설치

2. 테이블 추출하기

3. 데이터 프레임으로 변환

'Language > Python' 카테고리의 다른 글

1. 가상환경 Export

2. 가상환경 생성

3. 가상환경 업데이트

Reference

'Language > Python' 카테고리의 다른 글

1. init powershell in Conda

2. 실행 정책 변경

3. Restart Powershell

기타

'Language > Python' 카테고리의 다른 글

1. Pycharm 다운로드

2. Pycharm 설치

3. 라이선스 인증

4. Pycharm 컴파일 설정(Interpreter)

'Language > Python' 카테고리의 다른 글

티스토리툴바

⓸ 지도 그리기 : `st.map()`

멀티페이지 App 만들기