Metadata-Version: 2.4
Name: harina-v3-cli
Version: 3.0.1
Summary: CLI tool to recognize receipt images using Gemini API and output in XML format
Author-email: Developer <developer@example.com>
License: MIT
Project-URL: Homepage, https://github.com/example/harina-v3-cli
Project-URL: Repository, https://github.com/example/harina-v3-cli
Requires-Python: >=3.8
Description-Content-Type: text/markdown
License-File: LICENSE
Requires-Dist: litellm>=1.0.0
Requires-Dist: click>=8.0.0
Requires-Dist: pillow>=9.0.0
Requires-Dist: requests>=2.28.0
Requires-Dist: python-dotenv>=1.0.0
Requires-Dist: google-cloud-aiplatform>=1.0.0
Requires-Dist: google-auth>=2.0.0
Requires-Dist: loguru>=0.7.0
Dynamic: license-file

<div align="center">
  <img src="https://raw.githubusercontent.com/Sunwood-ai-labs/harina-v3-cli/refs/heads/main/header.png" alt="Harina v3 CLI" />
  <h1>Harina v3 CLI</h1>
  
  <p>
    <img src="https://img.shields.io/pypi/v/harina-v3-cli.svg" alt="PyPI version">
    <img src="https://img.shields.io/badge/python-3.8+-blue.svg" alt="Python 3.8+">
    <img src="https://img.shields.io/badge/AI-Gemini%20%7C%20GPT%20%7C%20Claude-green.svg" alt="AI Models">
    <img src="https://img.shields.io/badge/license-MIT-blue.svg" alt="MIT License">
    <img src="https://img.shields.io/badge/CLI-Receipt%20OCR-orange.svg" alt="CLI Tool">
  </p>
</div>

レシート画像を認識してXML形式で出力するCLIツールです。LiteLLM経由で複数のAIプロバイダー（Google Gemini、OpenAI、Anthropic Claude等）を使用してレシートの内容を解析します。

## ✨ 機能

- レシート画像からテキスト情報を抽出
- 店舗情報、商品情報、金額情報を構造化されたXML形式で出力
- Google Gemini APIを使用した高精度な画像認識
- コマンドライン インターフェース

## 🚀 クイックスタート

```bash
# PyPIからインストール
pip install harina-v3-cli

# 使用方法
harina path/to/receipt.jpg
```

## 📦 インストール

### PyPIからインストール（推奨）

```bash
pip install harina-v3-cli
```

### 開発者向けインストール

```bash
# リポジトリをクローン
git clone https://github.com/Sunwood-ai-labs/harina-v3-cli.git
cd harina-v3-cli

# 依存関係をインストール
uv sync

# 開発モードでインストール
uv pip install -e .
```

## 💡 使用方法

### 🔑 環境変数の設定

APIキーを設定するには、`.env`ファイルを使用します：

```bash
# .envファイルの例をコピー
cp .env.example .env
```

`.env`ファイルを編集してAPIキーを設定：

```
# Google Geminiを使用する場合（デフォルト）
GEMINI_API_KEY=your_actual_gemini_api_key_here

# その他のプロバイダーについては.env.exampleを参照
```

**詳細な環境変数設定については、[開発者向けガイド](docs/DEVELOPMENT.md)をご覧ください。**

### 🛠️ 基本的な使用方法

```bash
# 標準出力にXMLを出力（デフォルト: Gemini 1.5 Flash）
harina path/to/receipt_image.jpg

# ファイルに出力
harina path/to/receipt_image.jpg -o output.xml

# 異なるGeminiモデルを使用
harina path/to/receipt_image.jpg --model gemini/gemini-1.5-pro

# OpenAIのGPT-4oを使用する場合（OPENAI_API_KEYが必要）
harina path/to/receipt_image.jpg --model gpt-4o

# Claude 3 Sonnetを使用する場合（ANTHROPIC_API_KEYが必要）
harina path/to/receipt_image.jpg --model claude-3-sonnet-20240229

# 環境変数でデフォルトモデルを設定
export HARINA_MODEL=gpt-4o
harina path/to/receipt_image.jpg
```

### 📄 出力形式

XMLの出力形式は以下のようになります：

```xml
<?xml version="1.0" ?>
<receipt>
  <store_info>
    <name>店舗名</name>
    <address>住所</address>
    <phone>電話番号</phone>
  </store_info>
  <transaction_info>
    <date>2024-01-15</date>
    <time>14:30</time>
    <receipt_number>12345</receipt_number>
  </transaction_info>
  <items>
    <item>
      <name>商品名1</name>
      <quantity>1</quantity>
      <unit_price>100</unit_price>
      <total_price>100</total_price>
    </item>
    <item>
      <name>商品名2</name>
      <quantity>2</quantity>
      <unit_price>200</unit_price>
      <total_price>400</total_price>
    </item>
  </items>
  <totals>
    <subtotal>500</subtotal>
    <tax>50</tax>
    <total>550</total>
  </totals>
  <payment_info>
    <method>現金</method>
    <amount_paid>1000</amount_paid>
    <change>450</change>
  </payment_info>
</receipt>
```

## 🖼️ 対応画像形式

- JPEG (.jpg, .jpeg)
- PNG (.png)
- GIF (.gif)
- BMP (.bmp)
- その他PIL（Pillow）でサポートされている形式

## 📋 必要な依存関係

- Python 3.8以上
- litellm
- click
- pillow
- requests

## 🔐 API キーの取得

使用するモデルプロバイダーに応じて、以下からAPIキーを取得してください：

| プロバイダー         | 取得先                                                       | 環境変数            |
| -------------------- | ------------------------------------------------------------ | ------------------- |
| **Google Gemini**    | [Google AI Studio](https://makersuite.google.com/app/apikey) | `GEMINI_API_KEY`    |
| **OpenAI GPT**       | [OpenAI Platform](https://platform.openai.com/api-keys)      | `OPENAI_API_KEY`    |
| **Anthropic Claude** | [Anthropic Console](https://console.anthropic.com/)          | `ANTHROPIC_API_KEY` |

### 🔒 セキュリティに関する重要な注意事項

- **APIキーを直接コードに書き込まないでください**
- **APIキーをGitリポジトリにコミットしないでください**
- `.env`ファイルは`.gitignore`に含まれているため、Gitで追跡されません
- 本番環境では環境変数を使用してAPIキーを設定してください
- APIキーが漏洩した場合は、すぐにGoogle AI Studioで無効化し、新しいキーを生成してください

## 📚 詳細ドキュメント

- [💡 使用例とサンプル](example/README.md)
- [🔧 開発者向けガイド](docs/DEVELOPMENT.md)

## 📄 ライセンス

MIT License
