<div dir="ltr">Hey Tom,<div><br></div><div>If I were looking to start something new, I&#39;d look hard into docker.  Spark and Storm are neat if you like stream processing. Kafka is a niche.  It needs to mature or it will be replaced.</div><div><br></div><div>$0.02.</div><div><br></div><div>Good luck.</div></div><div class="gmail_extra"><br><div class="gmail_quote">On Fri, Nov 21, 2014 at 10:56 PM, Tom Hanlon <span dir="ltr">&lt;<a href="mailto:tom@functionalmedia.com" target="_blank">tom@functionalmedia.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Thanks Chris,<br>
<br>
As a hadoop instructor of 4 years, i was looking to get into something<br>
more interesting then the jumble of tools, and focus on one tool.<br>
<br>
Kafka, storm and spark are all candidates, and perhaps docker.<br>
<br>
My plan is to learn one of them well enough to teach it. Kafka and<br>
Docker and Storm seem to be in demand, but not well served with<br>
training. Spark is in demand, but some training exists.<br>
<br>
Your summary is useful, I think I will read what documentation is out<br>
there, and have a look at the code and see if I like it well enough to<br>
keep learning.<br>
<br>
--<br>
Tom<br>
<div class="HOEnZb"><div class="h5"><br>
<br>
<br>
On Fri, Nov 21, 2014 at 9:42 PM, Chris Embree &lt;<a href="mailto:cembree@ez-as.net">cembree@ez-as.net</a>&gt; wrote:<br>
&gt; 8-o   So many questions.<br>
&gt;<br>
&gt; List is fine, nothing secret here, just my opinions which are now<br>
&gt; worth slightly less than you paid for them.... sorry.<br>
&gt;<br>
&gt; We run a limited size cluster due to physical limits.  That said, it&#39;s<br>
&gt; anywhere from 10 -14 kafka nodes.  Each w/ 2 dedicated 10k disks.  GC<br>
&gt; hasn&#39;t shown up as an issue so far, but it might be the culprit behind<br>
&gt; a couple of anomalous issues.<br>
&gt;<br>
&gt; Generally, as a cluster is seems somewhat immature.  It works well<br>
&gt; when it works well, otherwise things get ugly.<br>
&gt;<br>
&gt; It can use JMX for monitoring, but management tools are somewhat<br>
&gt; limited.  One of smart guys on my team built a tool, dubbed Kurator<br>
&gt; (play on ES tools) that uses some Python Kafka API&#39;s to provide some<br>
&gt; insight.  However, it relies heavily on Zookeeper status and Kafka<br>
&gt; telling the truth.  We&#39;ve seen a few issues that raise doubt about<br>
&gt; Kafka&#39;s agreement w/ ZK on what&#39;s real.<br>
&gt;<br>
&gt; HOWEVER:  Our use case is extremely abusive.  We&#39;re looking for 1.2M<br>
&gt; 1K transactions per second.  If you are anywhere south of 100K/s<br>
&gt; chances are extremely good you can construct a highly reliable Kafka<br>
&gt; Cluster.<br>
&gt;<br>
&gt; On the fence:  We&#39;ve had little luck re-allocating partitions to<br>
&gt; recover from a lost node.  Listing Kafka topics will show you the #<br>
&gt; and nodes hosting In Sync Replicas (ISR).    The re-balance feature is<br>
&gt; somewhat new and lightly documented, at least at last Google.  I&#39;ve<br>
&gt; had little luck re-syncing after a node loss.<br>
&gt;<br>
&gt; Kafka is a minor part of our solution in the grand scheme of things.<br>
&gt; I feel ill equipped to give a talk on the subject in any reasonable<br>
&gt; depth.<br>
&gt;<br>
&gt; That said, I will be speaking at Cisco Live Milan (EMEA).  I&#39;d be<br>
&gt; happy to re-present at a COLUG if there is any value.  The talk is a 4<br>
&gt; hour tech session (I&#39;m only 1 of 3 speakers) on the entire openSOC<br>
&gt; project.  My focus will be on the platform side and it may not be the<br>
&gt; best fit for a LUG.  It&#39;s more of a HUG topic.<br>
&gt;<br>
&gt; FWIW, I absolutely hate the name Hadoop. ;)<br>
&gt;<br>
&gt; I hope that helps.<br>
&gt;<br>
&gt; Chris<br>
&gt;<br>
&gt; On 11/21/14, Tom Hanlon &lt;<a href="mailto:tom@functionalmedia.com">tom@functionalmedia.com</a>&gt; wrote:<br>
&gt;&gt; Chris,<br>
&gt;&gt;<br>
&gt;&gt; Can you talk about it on the list ? If not maybe we can send some<br>
&gt;&gt; private emails.<br>
&gt;&gt;<br>
&gt;&gt; How big is the kafka cluster ? How many events are handled?<br>
&gt;&gt;<br>
&gt;&gt; What are the details of the hiccups ? Java Garbage collection?<br>
&gt;&gt; Configuration changes ? General strangeness ?<br>
&gt;&gt;<br>
&gt;&gt; Does it provide any hooks for monitoring or managing? Nagios for<br>
&gt;&gt; monitoring ? Some api hooks for management ?<br>
&gt;&gt;<br>
&gt;&gt; Thanks,<br>
&gt;&gt; Tom<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; On Fri, Nov 21, 2014 at 1:17 PM, Chris Embree &lt;<a href="mailto:cembree@ez-as.net">cembree@ez-as.net</a>&gt; wrote:<br>
&gt;&gt;&gt; Sadly, yes.<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; We&#39;re using Kafka as the buffering queue for OpenSOC (<a href="http://getopensoc.com" target="_blank">getopensoc.com</a>)<br>
&gt;&gt;&gt; and while it works well when things are fine, it has significant<br>
&gt;&gt;&gt; difficulty recovering from hiccups.<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; Also, there are few tools for managing it from an Admin point of view.<br>
&gt;&gt;&gt; Deleting a topic is a non-trivial task, for example.<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; Chris<br>
&gt;&gt;&gt;<br>
&gt;&gt;&gt; On 11/21/14, Tom Hanlon &lt;<a href="mailto:tom@functionalmedia.com">tom@functionalmedia.com</a>&gt; wrote:<br>
&gt;&gt;&gt;&gt; Colug,<br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt; Are there any kafka users on this list.<br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt; <a href="http://kafka.apache.org/" target="_blank">http://kafka.apache.org/</a><br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt; I am looking to dive into kafka and some use-case, war-story,<br>
&gt;&gt;&gt;&gt; discussion with a user would be helpful.<br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt; If there is broader interest perhaps we can make a meeting<br>
&gt;&gt;&gt;&gt; presentation out of it.<br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt; Thanks,<br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt;&gt; Tom<br>
&gt;&gt;&gt;&gt; _______________________________________________<br>
&gt;&gt;&gt;&gt; colug-432 mailing list<br>
&gt;&gt;&gt;&gt; <a href="mailto:colug-432@colug.net">colug-432@colug.net</a><br>
&gt;&gt;&gt;&gt; <a href="http://lists.colug.net/mailman/listinfo/colug-432" target="_blank">http://lists.colug.net/mailman/listinfo/colug-432</a><br>
&gt;&gt;&gt;&gt;<br>
&gt;&gt;&gt; _______________________________________________<br>
&gt;&gt;&gt; colug-432 mailing list<br>
&gt;&gt;&gt; <a href="mailto:colug-432@colug.net">colug-432@colug.net</a><br>
&gt;&gt;&gt; <a href="http://lists.colug.net/mailman/listinfo/colug-432" target="_blank">http://lists.colug.net/mailman/listinfo/colug-432</a><br>
&gt;&gt; _______________________________________________<br>
&gt;&gt; colug-432 mailing list<br>
&gt;&gt; <a href="mailto:colug-432@colug.net">colug-432@colug.net</a><br>
&gt;&gt; <a href="http://lists.colug.net/mailman/listinfo/colug-432" target="_blank">http://lists.colug.net/mailman/listinfo/colug-432</a><br>
&gt;&gt;<br>
&gt; _______________________________________________<br>
&gt; colug-432 mailing list<br>
&gt; <a href="mailto:colug-432@colug.net">colug-432@colug.net</a><br>
&gt; <a href="http://lists.colug.net/mailman/listinfo/colug-432" target="_blank">http://lists.colug.net/mailman/listinfo/colug-432</a><br>
_______________________________________________<br>
colug-432 mailing list<br>
<a href="mailto:colug-432@colug.net">colug-432@colug.net</a><br>
<a href="http://lists.colug.net/mailman/listinfo/colug-432" target="_blank">http://lists.colug.net/mailman/listinfo/colug-432</a><br>
</div></div></blockquote></div><br></div>