<html><head></head><body><div style="color:#000; background-color:#fff; font-family:times new roman, new york, times, serif;font-size:16px"><div id="yui_3_16_0_ym19_1_1484580686381_106135" dir="ltr"><span id="yui_3_16_0_ym19_1_1484580686381_106134">I'm not going to try to reply to each point raised by each of you, but I will say that having someone else scan the pictures sounds like it might be the best bet. &nbsp;All of you have given me good information to consider...thanks.</span></div><div id="yui_3_16_0_ym19_1_1484580686381_106135" dir="ltr"><span><br></span></div><div id="yui_3_16_0_ym19_1_1484580686381_106135" dir="ltr">I'll note that some of the pictures I've uncovered so far are dating back to the 1930's, or even earlier. &nbsp;I'd be very leery of damaging them with an automatic feeder. &nbsp;However, I'd also be happy enough to do them a few at a time, making a longer-term project of it (and that appeals to my cheapskate nature.)</div><div id="yui_3_16_0_ym19_1_1484580686381_106135" dir="ltr"><br></div><div id="yui_3_16_0_ym19_1_1484580686381_106135" dir="ltr">More research lies ahead, I think. &nbsp;I'll be better prepared now that I have this additional information.</div><div id="yui_3_16_0_ym19_1_1484580686381_106135" dir="ltr"><br></div><div id="yui_3_16_0_ym19_1_1484580686381_106135" dir="ltr">Thanks again...</div><div class="qtdSeparateBR" id="yui_3_16_0_ym19_1_1484580686381_106136"><br></div><div class="qtdSeparateBR" id="yui_3_16_0_ym19_1_1484580686381_106136"><br></div><div class="qtdSeparateBR" id="yui_3_16_0_ym19_1_1484580686381_106136">-peter</div><div class="qtdSeparateBR" id="yui_3_16_0_ym19_1_1484580686381_106136"><br><br></div><div class="yahoo_quoted" id="yui_3_16_0_ym19_1_1484580686381_106183" style="display: block;">  <div style="font-family: times new roman, new york, times, serif; font-size: 16px;" id="yui_3_16_0_ym19_1_1484580686381_106182"> <div style="font-family: HelveticaNeue, Helvetica Neue, Helvetica, Arial, Lucida Grande, sans-serif; font-size: 16px;" id="yui_3_16_0_ym19_1_1484580686381_106181"> <div dir="ltr" id="yui_3_16_0_ym19_1_1484580686381_106180"> <font size="2" face="Arial" id="yui_3_16_0_ym19_1_1484580686381_106179"> <hr size="1" id="yui_3_16_0_ym19_1_1484580686381_106184"> <b id="yui_3_16_0_ym19_1_1484580686381_106229"><span style="font-weight:bold;" id="yui_3_16_0_ym19_1_1484580686381_106228">From:</span></b> Jim Wildman &lt;jim@rossberry.com&gt;<br> <b><span style="font-weight: bold;">To:</span></b> Central OH Linux User Group - 432xx &lt;colug-432@colug.net&gt; <br> <b><span style="font-weight: bold;">Sent:</span></b> Tuesday, January 17, 2017 11:22 AM<br> <b id="yui_3_16_0_ym19_1_1484580686381_106451"><span style="font-weight: bold;" id="yui_3_16_0_ym19_1_1484580686381_106450">Subject:</span></b> Re: [colug-432] Photo digitization recommendations?<br> </font> </div> <div class="y_msg_container" id="yui_3_16_0_ym19_1_1484580686381_106230"><br>If you have the negatives, negative scanning might be an option as well.&nbsp; My wife worked at Walmart photo for about a year and managed to<br clear="none">scan all of our pre-digital negatives to CD on her lunch breaks.<br clear="none"><div class="yqt3184018374" id="yqtfd18274"><br clear="none">On Mon, 16 Jan 2017, Rick Hornsby wrote:<br clear="none"><br clear="none">&gt; <br clear="none">&gt; I'll give you my feedback as a photographer, but not necessarily as someone who has tried to come up with a shared/distributed end-to-end<br clear="none">&gt; system like you're aiming at here.<br clear="none">&gt; <br clear="none">&gt; On January 12, 2017 at 12:32:19, Peter Kukla (<a shape="rect" ymailto="mailto:fruviad@yahoo.com" href="mailto:fruviad@yahoo.com" id="yui_3_16_0_ym19_1_1484580686381_106443">fruviad@yahoo.com</a>) wrote:<br clear="none">&gt; <br clear="none">&gt; Hi COLUGers,<br clear="none">&gt; <br clear="none">&gt; I have hundreds -- maybe thousands -- of photographs that I'd like to scan.&nbsp; My goal is to digitize the whole batch and distribute them<br clear="none">&gt; to the family members of those in the pictures.<br clear="none">&gt; <br clear="none">&gt; For the "thousands" volume you're looking at, you won't want a flatbed scanner. It is going to take you freaking forever. Even if you put<br clear="none">&gt; multiple images on the scanner bed at once, you still have to now digitally cut them back into individual photographs.<br clear="none">&gt; <br clear="none">&gt; You definitely _do_ want a flatbed scanner for old, damaged, or delicate prints that can't be put through an automatic document feeder type<br clear="none">&gt; system. If you use an ADF, make sure it is one designed for photographs. A normal sheet feeder may mangle your one-of-a-kind print.<br clear="none">&gt; <br clear="none">&gt; Photographers digitizing images will sometimes use an actual camera to photograph the print. This is requires a light box, and is labor<br clear="none">&gt; intensive, but can provide a very high quality result and can reduce the risk to the print.<br clear="none">&gt; <br clear="none">&gt; With that said, I strongly suggest finding a local vendor that can do the digitizing for you. Unless you just have a lot of time on your<br clear="none">&gt; hands.<br clear="none">&gt;<br clear="none">&gt;&nbsp; &nbsp; &nbsp;  I have a Linux-based household, so the hardware &amp; software would need to be Linux-friendly.&nbsp; Hence my bugging you guys.<br clear="none">&gt;<br clear="none">&gt;&nbsp; &nbsp; &nbsp;  The project will require a fast scanner, given the number of photos in question.&nbsp; Waiting 2-3 minutes for each scan to complete is<br clear="none">&gt;&nbsp; &nbsp; &nbsp;  fine if I only have a few pages to scan, but not for a large project like this.<br clear="none">&gt; <br clear="none">&gt; You can't do a fast _and_ quality scan of a print photograph with off the shelf gear. Remember that a print is an analog medium with (a<br clear="none">&gt; comparatively) massive resolution. Your best bet, honestly, is to give your prints to a vendor that specializes in digitizing them. From<br clear="none">&gt; there, you can take the digital versions and do whatever you like with them - cataloging, setting metadata, allowing others to set metadata<br clear="none">&gt; through a web UI, etc. You can ask the vendor to provide you the original TIFF images (they're going to be huge files), and then you can use<br clear="none">&gt; something like imagemagick to convert them down to JPEG for the next steps in your process.<br clear="none">&gt; <br clear="none">&gt; If you decide to do it yourself, you're going to have to be patient and it is going to take a long time to scan them all.<br clear="none">&gt; <br clear="none">&gt; You can save yourself filesize by converting the TIFFs down to monitor-ready 72dpi JPEGs once they're scanned, but to transfer the analog into<br clear="none">&gt; digital initially, you want as much resolution as your scanner will offer for a color print. If you set the scanner to capture at 72dpi, your<br clear="none">&gt; images will look like garbage. For preserving as much quality as possible, I'd also probably not let the scanner software do the JPEG<br clear="none">&gt; conversion even if it offers that feature.<br clear="none">&gt;<br clear="none">&gt;&nbsp; &nbsp; &nbsp;  Once scanned, I'll need to catalog the photos, describing who is depicted in each one.&nbsp; In the interest of ensuring that the<br clear="none">&gt;&nbsp; &nbsp; &nbsp;  metadata is associated with the photos, one thought is to embed the metadata via IPTC tags, although I haven't explored that<br clear="none">&gt;&nbsp; &nbsp; &nbsp;  option very deeply yet.<br clear="none">&gt; <br clear="none">&gt; <br clear="none">&gt; IPTC tags are a good choice. Take a look at the tags and tools for managing EXIF/IPTC data. For library and CLI usage, exiftool is one of the<br clear="none">&gt; best I know of:<br clear="none">&gt; <br clear="none">&gt; <a shape="rect" href="http://www.sno.phy.queensu.ca/~phil/exiftool/" target="_blank">http://www.sno.phy.queensu.ca/~phil/exiftool/</a><br clear="none">&gt;<br clear="none">&gt;&nbsp; &nbsp; &nbsp;  However, the photos being scanned also are mostly of people I don't know (many pictures are from the wife's side of the family)<br clear="none">&gt;&nbsp; &nbsp; &nbsp;  and the family members who would know are widely dispersed, geographically.&nbsp; It would be nice to have some sort of web-based, open<br clear="none">&gt;&nbsp; &nbsp; &nbsp;  source solution where I could load the images into a database of some sort and allow users to tag the pictures with details that I<br clear="none">&gt;&nbsp; &nbsp; &nbsp;  may not know ("Hey...that's Uncle Gump at our 1973 Grand Penguin Ball!")<br clear="none">&gt;<br clear="none">&gt;&nbsp; &nbsp; &nbsp;  Anyone ever done anything along these lines?<br clear="none">&gt;<br clear="none">&gt;&nbsp; &nbsp; &nbsp;  I'm looking for recommendations &amp; advice for:<br clear="none">&gt;<br clear="none">&gt;&nbsp; &nbsp; &nbsp;  &nbsp;&nbsp;&nbsp;&nbsp;* Good, reliable, and fast flat-bed scanners that are Linux-friendly<br clear="none">&gt; <br clear="none">&gt; The best I'm able to give you there is to point you at something like this: <a shape="rect" href="http://www.pcmag.com/article2/0,2817,2362752,00.asp" target="_blank">http://www.pcmag.com/article2/0,2817,2362752,00.asp</a><br clear="none">&gt; <br clear="none">&gt; Here's what else I'd say about that: you are free to insist on Linux if you wish. However, you may have difficulty finding software that<br clear="none">&gt; provides an efficient workflow pattern. That is, I think you can use GiMP to scan things, but you'll probably want to smash your mouse with a<br clear="none">&gt; big hammer trying to use GiMP for the volume you need. It simply wasn't designed for that. Chances are you'll have much better luck finding<br clear="none">&gt; the right tool for volume scanning in Windows or MacOS. You may have to bite the bullet and buy a Windows license for this project. (I think<br clear="none">&gt; you can d/l and use Windows 10 for 30 days before it starts harassing you.)<br clear="none">&gt; <br clear="none">&gt; To put it another way, I can use a screwdriver to apply and sand drywall mud because damit everyone in the house has a screwdriver and it's<br clear="none">&gt; the best tool there is. But holy crap it's going to be a pain in the ass to fix a head-sized dent this way.<br clear="none">&gt;<br clear="none">&gt;&nbsp; &nbsp; &nbsp;  &nbsp; &nbsp; * Preferred image formats (the IPTC aspect may reduce the number of options?)<br clear="none">&gt; <br clear="none">&gt; TIFF for the archived originals, JPEG for everything else. JPEG without question, whether you decide to keep the TIFF originals or not. As far<br clear="none">&gt; as JPEG compression, 85% quality is right around the breaking point where the larger filesize penalty starts to hit without a discernible<br clear="none">&gt; image quality retention. You can go up to 90%, but at 72dpi I don't think it will matter. You could go down to 80%, but it's really not worth<br clear="none">&gt; it. Anything lower and your photos will start to look bad.<br clear="none">&gt; <br clear="none">&gt; I should mention that once you drop the image resolution down to 72dpi, the resulting file will not be suitable for printing. Yes, the local<br clear="none">&gt; drug store will still print it for you, but the quality is going to be poor. Creating prints from digital images, especially anything larger<br clear="none">&gt; than small sizes like 4x6, needs an image resolution of at least 240dpi.<br clear="none">&gt; <br clear="none">&gt; Side note: if you want a quality print, please don't go to the local drug store. They produce awful results. I mean, really awful. Use a<br clear="none">&gt; professional print service like mpix or one of the others.<br clear="none">&gt; <br clear="none">&gt; I suggested dropping down to 72dpi because that's typically the highest useful dpi that can be displayed on a tv or monitor. Anything higher<br clear="none">&gt; is just wasted filesize - including on a website where people are just manipulating the metadata. You can always copy the metadata from the<br clear="none">&gt; screen-resolution images to your high res images on the backend.<br clear="none">&gt; <br clear="none">&gt; JPEG is an excellent format for storing photographs. TIFF is superior quality (lossless compression), but a very large file size. PNG<br clear="none">&gt; compression is lossless as well, but to handle the larger color palette of a photograph means a significantly larger file size, or a smaller<br clear="none">&gt; color depth which is bad for a photograph. PNGs are much better suited as GIF replacements or for screengrabs. It's not good for photos.<br clear="none">&gt; <br clear="none">&gt; JPEG can handle the EXIF/IPTC data. However, here's something important to remember about JPEG images: because the compression is lossy, every<br clear="none">&gt; image edit incurs a quality penalty in the resulting saved file. If you need to make image edits (crop, color correction, etc) - do those in<br clear="none">&gt; the original TIFF image and then export to JPEG. Don't open the JPEG, edit the image, save/close it, and then come back later to do more<br clear="none">&gt; edits. At a low compression ratio (high quality), you can get away with doing it a few times. Even at 100% quality setting, there's still<br clear="none">&gt; lossy compression and thus still a quality penalty.<br clear="none">&gt; <br clear="none">&gt; This penalty does not apply to editing the metadata using things like exiftool. It only applies to the image itself.<br clear="none">&gt;<br clear="none">&gt;&nbsp; &nbsp; &nbsp;  &nbsp;&nbsp;&nbsp;&nbsp;* A web-based digital archive system that supports user feedback and possibly downloading of the original images<br clear="none">&gt; <br clear="none">&gt; Feedback and downloading the original, yes. There are tons of both self-hosted and "cloud-based" solutions. Of these, which allow unlimited<br clear="none">&gt; access to edit the IPTC fields? That may have to be something more home grown, I'm not sure.<br clear="none">&gt; <br clear="none">&gt; If you plan to allow them to download the original from the website and you're rolling your own solution, then plan to have two different JPEG<br clear="none">&gt; image files - one a medium resolution (1600px on the long edge should be good) for displaying in the webpage, and the high resolution JPEG<br clear="none">&gt; file they can download. You may want the high res image to have a higher preserved dpi from the TIFF as well. 4000px on the long edge at<br clear="none">&gt; 200dpi should be sufficient for most people's small print needs.<br clear="none">&gt;<br clear="none">&gt;&nbsp; &nbsp; &nbsp;  &nbsp;&nbsp;&nbsp;&nbsp;* Any pitfalls I may encounter that I haven't yet thought about<br clear="none">&gt; <br clear="none">&gt; Remember to think about your audience when designing a UI for them. These will almost certainly be non-technical people who won't understand<br clear="none">&gt; the IPTC labels, and who will probably make mistakes when entering the data. It might be helpful to design it in such a way that there's some<br clear="none">&gt; editorial control. That is, if possible for example, try to ensure grandma can't accidentally overwrite Aunt June's valid/good description<br clear="none">&gt; with a copy/paste of your email address. Figuring out ways to manage the data and manage the user input of your system will probably end up<br clear="none">&gt; being more work than you anticipate. Then again, it's very possible someone has already solved this very thing and there's a suitable product<br clear="none">&gt; out there.<br clear="none">&gt; <br clear="none">&gt; To preserve your sanity, it might be helpful to spend some time with your wife or your geographically proximate family to knock out what you<br clear="none">&gt; can, before crowdsourcing to the family what you can't.<br clear="none">&gt; <br clear="none">&gt; Good luck, and let us know what you come up with.<br clear="none">&gt; <br clear="none">&gt; -rj</div><br clear="none">&gt; <br clear="none">&gt; <br clear="none">&gt;<br clear="none"><br clear="none">----------------------------------------------------------------------<br clear="none">Jim Wildman, CISSP, RHCE&nbsp; &nbsp; &nbsp;  <a shape="rect" ymailto="mailto:jim@rossberry.com" href="mailto:jim@rossberry.com">jim@rossberry.com</a> <a shape="rect" href="http://www.rossberry.net/" target="_blank">http://www.rossberry.net</a><br clear="none">"Society in every state is a blessing, but Government, even in its best<br clear="none">state, is a necessary evil; in its worst state, an intolerable one."<br clear="none">Thomas Paine<br>_______________________________________________<br clear="none">colug-432 mailing list<br clear="none"><a shape="rect" ymailto="mailto:colug-432@colug.net" href="mailto:colug-432@colug.net">colug-432@colug.net</a><br clear="none"><a shape="rect" href="http://lists.colug.net/mailman/listinfo/colug-432" target="_blank">http://lists.colug.net/mailman/listinfo/colug-432</a><div class="yqt3184018374" id="yqtfd14398"><br clear="none"></div><br><br></div> </div> </div>  </div></div></body></html>