Refactor to be more time/space efficient
authorAlex Chan <alex@alexwlchan.net>
Thu, 20 Feb 2020 08:38:43 +0000 (08:38 +0000)
committerAlex Chan <alex@alexwlchan.net>
Thu, 20 Feb 2020 08:38:43 +0000 (08:38 +0000)
commit02543c9f2f180c1b00badeaeb0119890940699d6
tree5ded819f5b9677d5a35a8baf5e152d10ca47c61d
parentf098c26a0c02e76968169d2686991b35c4650d49
Refactor to be more time/space efficient

* If two episodes have different Overcast IDs but the same MP3 URL,
  they might be the same or they might be different (it's a bit fiddly
  to tell; less likely now I disambiguate on the basis of titles, but
  still).  If the two MP3s are byte-for-byte identical, don't keep
  multiple copies.

* If the RSS feed hasn't changed since the last fetch, don't store a
  second copy.

* Track episodes we've already downloaded in a sqlite database, so
  we don't have to redownload the MP3 to know it's the same.  This makes
  subsequent runs of the script much faster.
README.md
download_overcast_podcasts.py
requirements.in [deleted file]
requirements.txt [deleted file]