Ruff

2025-03-15 21:54:56 +01:00 · 2025-03-15 21:54:56 +01:00 · 3d9c694fe8
commit 3d9c694fe8
parent a0e8d1ec28
10 changed files with 177 additions and 113 deletions
--- a/.gitignore
+++ b/.gitignore
@ -18,3 +18,4 @@ __pycache__/
 /.coverage
 /.hypothesis/
 /htmlcov/
 .aider*
--- a/git_time_tracker/format/cli.py
+++ b/git_time_tracker/format/cli.py
@ -35,7 +35,9 @@ def fmt_line(label: Label, total_time: datetime.timedelta) -> str:
    label_str = str(label.label)
    return f'  {label.category:20} {label_str:50}  {hours:-4d}h {minutes:-2d}m'
-LINE_LENGTH = len(fmt_line(Label('',''), datetime.timedelta()))
+
 LINE_LENGTH = len(fmt_line(Label('', ''), datetime.timedelta()))
 def generate_report(
    samples: list[RealizedActivitySample],
--- a/obsidian_import/init.py
+++ b/obsidian_import/init.py
@ -31,6 +31,7 @@ HOUR = datetime.timedelta(hours=1)
 MINUTE = datetime.timedelta(minutes=1)
 SECOND = datetime.timedelta(seconds=1)
 def to_text_duration(duration: datetime.timedelta) -> str:
    hours = int(duration / HOUR)
    duration -= hours * HOUR
@ -129,6 +130,7 @@ def import_step_counts_csv(vault: ObsidianVault, rows: Rows) -> int:
    return num_updated
 def import_stepmania_steps_csv(vault: ObsidianVault, rows: Rows) -> int:
    num_updated = 0
@ -141,22 +143,32 @@ def import_stepmania_steps_csv(vault: ObsidianVault, rows: Rows) -> int:
    COLUMNS = ['score.w1', 'score.w2', 'score.w3', 'score.w4', 'score.w5']
-    def all_steps(row: dict[str,int]):
+    def all_steps(row: dict[str, int]):
        return sum(row[column] for column in COLUMNS)
    steps_per_date = {
-        date: sum(all_steps(row) for row in rows) for date, rows in rows_per_date.items()
+        date: sum(all_steps(row) for row in rows)
        for date, rows in rows_per_date.items()
    }
    duration_per_date = {
-        date: sum((row['play.duration'] for row in rows), start=datetime.timedelta()) for date, rows in rows_per_date.items()
+        date: sum((row['play.duration'] for row in rows), start=datetime.timedelta())
        for date, rows in rows_per_date.items()
    }
    print(steps_per_date)
    print(duration_per_date)
    for date in steps_per_date:
-        was_updated_1 = vault.add_statistic(date, 'Stepmania (Steps)', int(steps_per_date[date]))
+        was_updated_1 = vault.add_statistic(
-        was_updated_2 = vault.add_statistic(date, 'Stepmania (Duration)', to_text_duration(duration_per_date[date]))
+            date,
            'Stepmania (Steps)',
            int(steps_per_date[date]),
        )
        was_updated_2 = vault.add_statistic(
            date,
            'Stepmania (Duration)',
            to_text_duration(duration_per_date[date]),
        )
        if was_updated_1 or was_updated_2:
            num_updated += 1
        del date, was_updated_1, was_updated_2
@ -258,16 +270,36 @@ IMPORTERS = [
    {'path': PATH_WORKOUT, 'import_rows': import_workout_csv},
    {'path': PATH_STEP_COUNTS, 'import_rows': import_step_counts_csv},
    {'path': PATH_STEPMANIA, 'import_rows': import_stepmania_steps_csv},
-        {'path': PATH_PLAYED, 'import_rows': lambda vault, rows: import_activity_sample_csv(vault, rows, map_games_played_content, group_category='game.name',) },
+    {
-        {'path': PATH_WATCHED, 'import_rows': lambda vault, rows: import_activity_sample_csv(vault, rows, map_watched_series_content) },
+        'path': PATH_PLAYED,
        'import_rows': lambda vault, rows: import_activity_sample_csv(
            vault,
            rows,
            map_games_played_content,
            group_category='game.name',
        ),
    },
    {
        'path': PATH_WATCHED,
        'import_rows': lambda vault, rows: import_activity_sample_csv(
            vault,
            rows,
            map_watched_series_content,
        ),
    },
 ]
 def import_data(obsidian_path: Path, dry_run=True):
    vault = ObsidianVault(obsidian_path, read_only=dry_run and 'silent' or None)
    for import_def in IMPORTERS:
        if not import_def['path'].exists():
-            logger.warning('Skipping %s: %s is missing', import_def['import_rows'], import_def['path'])
+            logger.warning(
                'Skipping %s: %s is missing',
                import_def['import_rows'],
                import_def['path'],
            )
            continue
        rows = load_csv_file(import_def['path'])
        logger.info('Loaded CSV with %d lines', len(rows))
@ -275,7 +307,6 @@ def import_data(obsidian_path: Path, dry_run=True):
        logger.info('Updated %d files', num_files_updated)
        del import_def, rows
    num_dirty = len([f for f in vault.internal_file_text_cache.values() if f.is_dirty])
    logger.info('dirty files in cache: %d', num_dirty)
    logger.info(
--- a/personal_data/csv_import.py
+++ b/personal_data/csv_import.py
@ -114,7 +114,7 @@ class PossibleKeys:
    misc: list[str]
-def is_duration_key(k,v):
+def is_duration_key(k, v):
    if isinstance(v, Decimal) and 'duration_seconds' in k:
        return True
    if isinstance(v, datetime.timedelta) and 'duration' in k:
@ -125,11 +125,7 @@ def is_duration_key(k,v):
 def determine_possible_keys(event_data: dict[str, Any]) -> PossibleKeys:
    # Select data
    time_keys = [k for k, v in event_data.items() if isinstance(v, datetime.date)]
-    duration_keys = [
+    duration_keys = [k for k, v in event_data.items() if is_duration_key(k, v)]
        k
        for k, v in event_data.items()
        if is_duration_key(k,v)
    ]
    name_keys = [k for k, v in event_data.items() if isinstance(v, str)]
    image_keys = [
        k for k, v in event_data.items() if isinstance(v, urllib.parse.ParseResult)
--- a/personal_data/fetchers/gitea.py
+++ b/personal_data/fetchers/gitea.py
@ -1,8 +1,6 @@
 import dataclasses
 import datetime
 import logging
 from collections.abc import Iterator, Mapping
 from decimal import Decimal
 from typing import Any
 from personal_data.data import DeduplicateMode, Scraper
@ -11,16 +9,19 @@ from .. import secrets
 logger = logging.getLogger(__name__)
 def safe_del(d: dict, *keys: str):
    for key in keys:
        if key in d:
            del d[key]
-def to_data_point(p: dict[str,Any]) ->Mapping[str, Any]:
+
 def to_data_point(p: dict[str, Any]) -> Mapping[str, Any]:
    p['owner'] = p['owner']['login']
    safe_del(p, 'permissions', 'internal_tracker')
    return p
@dataclasses.dataclass(frozen=True)
 class Gitea(Scraper):
    dataset_name = 'gitea_repos'
@ -32,13 +33,16 @@ class Gitea(Scraper):
        return False
    def scrape(self) -> Iterator[Mapping[str, Any]]:
-        response = self.session.get('https://gitfub.space/api/v1/repos/search', params = {
+        response = self.session.get(
            'https://gitfub.space/api/v1/repos/search',
            params={
                #'uid':21,
                'private': True,
-            'sort':'updated',
+                'sort': 'updated',
-            'order':'desc',
+                'order': 'desc',
                'access_token': secrets.gitea_access_token(),
-        })
+            },
        )
        response.raise_for_status()
        data = response.json()
--- a/personal_data/fetchers/myanimelist.py
+++ b/personal_data/fetchers/myanimelist.py
@ -1,18 +1,17 @@
-import abc
+import dataclasses
-import bs4
+import json
 import logging
 import re
 import urllib.parse
-import json
+from collections.abc import Iterator
-import dataclasses
+
-import logging
+import bs4
 import secrets
 from collections.abc import Iterator, Mapping
 from enum import Enum
 from personal_data.data import DeduplicateMode, Scraper
 logger = logging.getLogger(__name__)
@dataclasses.dataclass(frozen=True)
 class MyAnimeListAnime:
    series_name_eng: str
@ -21,6 +20,7 @@ class MyAnimeListAnime:
    series_icon: urllib.parse.ParseResult
    me_score: int
@dataclasses.dataclass(frozen=True)
 class MyAnimeListSong:
    song_name_eng: str
@ -48,25 +48,39 @@ class MyAnimeList(Scraper):
        for data_item in data_items:
            yield MyAnimeListAnime(
-                series_name_eng= data_item.get('anime_title_eng') or data_item.get('anime_title'),
+                series_name_eng=data_item.get('anime_title_eng')
-                series_name= data_item.get('anime_title') or data_item.get('anime_title_eng'),
+                or data_item.get('anime_title'),
-                series_myanimelist_url= urllib.parse.urlparse(urllib.parse.urljoin(url, data_item['anime_url'])),
+                series_name=data_item.get('anime_title')
-                series_icon= urllib.parse.urlparse(urllib.parse.urljoin(url, data_item['anime_image_path'])),
+                or data_item.get('anime_title_eng'),
-                me_score= data_item.get('score'),
+                series_myanimelist_url=urllib.parse.urlparse(
                    urllib.parse.urljoin(url, data_item['anime_url']),
                ),
                series_icon=urllib.parse.urlparse(
                    urllib.parse.urljoin(url, data_item['anime_image_path']),
                ),
                me_score=data_item.get('score'),
            )
            del data_item
 def parse_name(text: str):
    match = re.fullmatch(r'^(?:\d+:\s*)?"(.*?)(?:\((.*)\))?"$', text)
    return match
 assert parse_name('"Soundscape"')
 assert parse_name('"Soundscape (サウンドスケープ)"').group(2) is not None
 assert parse_name('1: "Soundscape"')
 assert parse_name('2: "Soundscape (サウンドスケープ)"').group(2) is not None
-def parse_songs(tr_elements, song_position: str, series_name_eng: str, series_name: str):
+
 def parse_songs(
    tr_elements,
    song_position: str,
    series_name_eng: str,
    series_name: str,
 ):
    print(series_name_eng, len(tr_elements))
    for song_tr in tr_elements:
        artist = song_tr.select_one('.theme-song-artist')
@ -77,26 +91,26 @@ def parse_songs(tr_elements, song_position: str, series_name_eng: str, series_na
            e.extract()
        del e
        song_artist = artist.get_text().strip().removeprefix('by ')
        song_name_eng = song_tr.get_text().strip()
-        m = parse_name(song_name_eng )
+        m = parse_name(song_name_eng)
        song_name_eng = m.group(1).strip()
        song_name_jp = m.group(2).strip() if m.group(2) else None
-        song= MyAnimeListSong(
+        song = MyAnimeListSong(
-            song_name_eng = song_name_eng ,
+            song_name_eng=song_name_eng,
-            song_name_jp = song_name_jp ,
+            song_name_jp=song_name_jp,
-            song_artist = song_artist,
+            song_artist=song_artist,
-            song_placement = song_position,
+            song_placement=song_position,
-            series_name_eng = series_name_eng,
+            series_name_eng=series_name_eng,
-            series_name = series_name,
+            series_name=series_name,
        )
        print('    ', song_name_eng)
        yield song
@dataclasses.dataclass(frozen=True)
 class MyAnimeListSongs(Scraper):
    dataset_name = 'myanimelist_songs'
@ -113,10 +127,18 @@ class MyAnimeListSongs(Scraper):
        for script in soup.select('.oped-popup'):
            script.extract()
-        yield from parse_songs(soup.select('.theme-songs.opnening table tr'),
+        yield from parse_songs(
-                               'opening', anime.series_name_eng, anime.series_name)
+            soup.select('.theme-songs.opnening table tr'),
-        yield from parse_songs(soup.select('.theme-songs.ending table  tr'),
+            'opening',
-                               'ending', anime.series_name_eng, anime.series_name)
+            anime.series_name_eng,
            anime.series_name,
        )
        yield from parse_songs(
            soup.select('.theme-songs.ending table  tr'),
            'ending',
            anime.series_name_eng,
            anime.series_name,
        )
    def scrape(self) -> Iterator[MyAnimeListSong]:
        for anime in MyAnimeList(self.session).scrape():
--- a/personal_data/fetchers/stepmania.py
+++ b/personal_data/fetchers/stepmania.py
@ -1,20 +1,20 @@
 import dataclasses
 import datetime
 import logging
 import datetime
 from collections.abc import Iterator, Mapping
 from decimal import Decimal
 from pathlib import Path
 import bs4
 import zoneinfo
 from collections.abc import Iterator, Mapping
 from pathlib import Path
 import bs4
 from personal_data.data import DeduplicateMode, Scraper
 from .. import secrets
 logger = logging.getLogger(__name__)
-STATS_FILE_PATH: Path = Path('/home/jmaa/.itgmania/Save/LocalProfiles/00000000/Stats.xml')
+STATS_FILE_PATH: Path = Path(
    '/home/jmaa/.itgmania/Save/LocalProfiles/00000000/Stats.xml',
 )
@dataclasses.dataclass(frozen=True)
 class Stepmania(Scraper):
@ -33,14 +33,16 @@ class Stepmania(Scraper):
        # Derp
        for score in soup.select('SongScores Song HighScoreList HighScore'):
            song = score.parent.parent.parent
-            song_path = Path(song ['Dir'].removesuffix('/'))
+            song_path = Path(song['Dir'].removesuffix('/'))
            disqualified = score.select_one('Disqualified').get_text().strip() != '0'
            if disqualified:
                logger.warning('Ignored disqualified')
                continue
-            play_start = datetime.datetime.fromisoformat(score.select_one('DateTime').get_text())
+            play_start = datetime.datetime.fromisoformat(
                score.select_one('DateTime').get_text(),
            )
            play_start = play_start.replace(tzinfo=timezone).astimezone(datetime.UTC)
            play_seconds = float(score.select_one('SurviveSeconds').get_text())
--- a/personal_data/secrets.py
+++ b/personal_data/secrets.py
@ -10,6 +10,7 @@ CRUNCHYROLL_AUTH = secrets.load('CRUNCHYROLL_AUTH')
 # FFXIV
 FFXIV_CHARACTER_ID = secrets.load('FFXIV_CHARACTER_ID')
 # Playstation
 def playstation_psn_id():
    return secrets.load_or_fail('PLAYSTATION_PSN_ID')
@ -24,6 +25,7 @@ def pbc_account_address():
 def steam_username():
    return secrets.load_or_fail('STEAM_USERNAME')
 # Gitea
 def gitea_access_token():
    return secrets.load('GITEA_ACCESS_TOKEN')
--- a/personal_data/util.py
+++ b/personal_data/util.py
@ -1,10 +1,8 @@
 import _csv
 import csv
 import dataclasses
 import datetime
 import io
 import logging
 import urllib.parse
 from collections.abc import Iterable, Mapping
 from pathlib import Path
 from typing import Any
@ -91,15 +89,18 @@ def deduplicate_dicts(
 def dataclass_to_dict(obj) -> dict[str, Any]:
    d = dataclasses.asdict(obj)
-    return {k.replace('_','.',1):v for k,v in d.items()}
+    return {k.replace('_', '.', 1): v for k, v in d.items()}
 def normalize_dict(d: dict[str, Any] | frozendict[str, Any]) -> frozendict[str, Any]:
    if not isinstance(d, dict) and not isinstance(d, frozendict):
        d = dataclass_to_dict(d)
    assert isinstance(d, dict) or isinstance(d, frozendict), 'Not a dict'
-    safe_values = [(k, csv_import.csv_str_to_value(csv_import.csv_safe_value(v))) for k, v in d.items() ]
+    safe_values = [
-    return frozendict( {k:v for k,v in safe_values if v is not None})
+        (k, csv_import.csv_str_to_value(csv_import.csv_safe_value(v)))
        for k, v in d.items()
    ]
    return frozendict({k: v for k, v in safe_values if v is not None})
 def extend_csv_file(
--- a/scripts/download_simfiles.py
+++ b/scripts/download_simfiles.py
@ -1,17 +1,16 @@
 import sys
 import bs4
 import zipfile
 import subprocess
 import csv
 import requests
 from pathlib import Path
 import personal_data.csv_import
 import personal_data.main
 import dataclasses
 import logging
 import subprocess
 from pathlib import Path
 import bs4
 import personal_data.csv_import
 import personal_data.main
 logger = logging.getLogger(__name__)
@dataclasses.dataclass
 class Result:
    title: str
@ -19,9 +18,8 @@ class Result:
    levels: str
-SESSION = personal_data.main.get_session(
+SESSION = personal_data.main.get_session([], with_cfscrape=False, ignore_cache=False)
-        [],
+
        with_cfscrape=False, ignore_cache=False)
 def parse_results(response) -> list[Result]:
    soup = bs4.BeautifulSoup(response.text, 'lxml')
@ -36,34 +34,40 @@ def parse_results(response) -> list[Result]:
            continue
        id = link['href'].removeprefix('viewsimfile.php?simfileid=')
        levels = cells[1].get_text().strip()
-        results.append(Result(title , int(id), levels))
+        results.append(Result(title, int(id), levels))
    return results
 def search_for_song(song_data) -> Result | None:
-    response = SESSION.post('https://zenius-i-vanisher.com/v5.2/simfiles_search_ajax.php',
+    response = SESSION.post(
        'https://zenius-i-vanisher.com/v5.2/simfiles_search_ajax.php',
        data={
            'songtitle': song_data['song.name_eng'],
            'songartist': song_data['song.artist'],
-              })
+        },
    )
    if results := parse_results(response):
        return results[0]
-    response = SESSION.post('https://zenius-i-vanisher.com/v5.2/simfiles_search_ajax.php',
+    response = SESSION.post(
        'https://zenius-i-vanisher.com/v5.2/simfiles_search_ajax.php',
        data={
            'songtitle': song_data['song.name_eng'],
            'songartist': '',
-              })
+        },
    )
    if results := parse_results(response):
        return results[0]
    logger.warning('No results for %s', song_data['song.name_eng'])
    return None
 def download_song(song_data, output_dir: Path):
    song_result = search_for_song(song_data)
    if song_result is None:
        return
-    path_zip = output_dir/f'zenius-{song_result.id}-{song_result.title}.zip'
+    path_zip = output_dir / f'zenius-{song_result.id}-{song_result.title}.zip'
    if path_zip.exists():
        logger.warning('Skipping existing file')
        return
@ -75,10 +79,11 @@ def download_song(song_data, output_dir: Path):
    cmd = ['curl', '-L', '--fail', url, '-o', path_zip]
    subprocess.run(cmd, check=True, capture_output=True)
 def main():
    csv_path = Path('./output/myanimelist_songs.csv')
    output_path = Path('./output/songs')
-    output_path.mkdir(exist_ok=True,parents=True)
+    output_path.mkdir(exist_ok=True, parents=True)
    songs = personal_data.csv_import.load_csv_file(csv_path)
    for song in songs:
@ -88,5 +93,3 @@ def main():
 if __name__ == '__main__':
    main()