# data-analysis

> データ分析・可視化・レポート作成。pandas、SQL、BigQuery、スプレッドシート操作、統計分析、グラフ作成。「データ分析」「SQL」「BigQuery」「pandas」「集計」「可視化」「レポート」に関する質問で使用。

- Author: take
- Repository: take566/kubernetes
- Version: 20260106094648
- Stars: 0
- Forks: 0
- Last Updated: 2026-02-06
- Source: https://github.com/take566/kubernetes
- Web: https://mule.run/skillshub/@@take566/kubernetes~data-analysis:20260106094648

---

---
name: data-analysis
description: データ分析・可視化・レポート作成。pandas、SQL、BigQuery、スプレッドシート操作、統計分析、グラフ作成。「データ分析」「SQL」「BigQuery」「pandas」「集計」「可視化」「レポート」に関する質問で使用。
---

# データ分析・可視化

## クイックスタート

### pandas 基本操作

```python
import pandas as pd

# 読み込み
df = pd.read_csv("data.csv")

# 基本統計
print(df.describe())

# フィルタリング
filtered = df[df["status"] == "active"]

# グループ集計
summary = df.groupby("category")["amount"].sum()
```

### BigQuery クエリ

```sql
SELECT
    DATE(created_at) AS date,
    COUNT(*) AS count,
    SUM(amount) AS total
FROM `project.dataset.orders`
WHERE created_at >= '2025-01-01'
GROUP BY date
ORDER BY date
```

## 分析フロー

1. **データ収集**: DB、API、ファイルから取得
2. **データクリーニング**: 欠損値、異常値処理
3. **探索的分析**: 傾向、分布、相関の把握
4. **集計・加工**: 必要な指標を算出
5. **可視化**: グラフ、ダッシュボード作成
6. **レポート**: 結果のまとめ

## 詳細ガイド

- **pandas操作**: [reference/pandas.md](reference/pandas.md)
- **SQL・BigQuery**: [reference/sql.md](reference/sql.md)
- **可視化**: [reference/visualization.md](reference/visualization.md)
- **統計分析**: [reference/statistics.md](reference/statistics.md)

## ユーティリティスクリプト

```bash
# データプロファイリング
python scripts/profile_data.py data.csv

# SQLクエリ実行・CSV出力
python scripts/query_to_csv.py query.sql output.csv

# レポート生成
python scripts/generate_report.py --input data.csv --output report.html
```

## ワークフロー: データ分析

```
進捗チェックリスト:
- [ ] 1. 目的・KPIの明確化
- [ ] 2. データソース特定・収集
- [ ] 3. データクリーニング
- [ ] 4. 探索的データ分析（EDA）
- [ ] 5. 詳細分析・仮説検証
- [ ] 6. 可視化・レポート作成
- [ ] 7. 結論・提言のまとめ
```