Architecture examples

MapR Streams

parallelism

Partition Id
Hash of messageId
Round-Robin

sending messages via client library

spreading message between partitions, assigning message to paritiion

by partition number
by message key
round-robin ( without previous two )
properties.put("streams.patitioner.class", "my.package.MyClassName.class")

public class MyClassName implements Partitioner{
   public int partition( String topic, Object, key, byte[] keyBytes, Object value, byte[] valueBytes, Cluster cluster){}
}

replication

reading messages via client library

reading messages cursor types

Read cursor ( client request it and broker sent )
Committed cursor ( client confirmed/commited reading )

Replicating streams

Master->Slave
Many->One
MultiMaster: Master<-->Master
Stream replications: Node-->Node2-->Node3-->Node4 ... ( with loop preventing )

command line

find CLDB hosts ( ContainerLocationDataBase )

maprcli node listcldbs

create stream

maprcli stream create -path <filepath & name>
maprcli stream create -path <filepath & name> -consumeperm u:<userId> -produceperm u:<userId> -topicperm u:<userId>

create topic

maprcli stream topic create -path <path and name of the stream> -topic <name of the topic>

API, java programming

producer

java example

Properties properties = new Properties();
properties.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");
properties.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");
// org.apache.kafka.common.serialization.ByteSerializer
// properties.put("client.id", <client id>)

import org.apache.kafka.clients.producer.KafkaProducer;
KafkaProducer producer = new KafkaProducer<String, String>(properties);

String streamTopic = "<streamname>:<topicname>"; // "/streams/my-stream:topic-name"
ProducerRecord<String, String> record = new ProducerRecord<String, String>(streamTopic, textOfMessage);
// ProducerRecord<String, String> record = new ProducerRecord<String, String>(streamTopic, messageTextKey, textOfMessage);
// ProducerRecord<String, String> record = new ProducerRecord<String, String>(streamTopic, partitionIntNumber, textOfMessage);

Callback callback = new Callback(){
  public void onCompletion(RecordMetadata meta, Exception ex){
    meta.offset();
  }
};
producer.send(record, callback);
producer.close();

sending conditions

parallel sending

streams.parallel.flushers.per.partition default true:

does not wait for ACK before sending more messages
possible for messages to arrive out of order

streams.parallel.flushers.per.partition set to false:

client library will wait for ACK from server
slower than default setting

retrieving metadata during connection with Kafka

metadata.max.age.ms

How frequently to fetch metadata

consumer

java consumer

Properties properties = new Properties();
properties.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
properties.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
// org.apache.kafka.common.serialization.ByteSerializer
// properties.put("auto.offset.reset", <Earliest, Latest, None>)
// properties.put("group.id", <group identificator>)
// properties.put("enable.auto.commit", <true - default | false >), use consumer.commitSync() if false
// properties.put("auto.commit.interval.ms", <default value 1000ms>)

import org.apache.kafka.clients.consumer.KafkaConsumer;
KafkaConsumer consumer = new KafkaConsumer<String, String>(properties);

String streamTopic = "<streamname>:<topicname>"; // "/streams/my-stream:topic-name"
consumer.subscribe(Arrays.asList(topic));
// consumer.subscribe(topic, new RebalanceListener());
ConsumerRecords<String, String> messages = consumer.poll(1000L); // reading with timeout
messages.iterator().next().toString(); // "/streams/my-stream:topic-name, parition=1, offset=256, key=one, value=text"

java rebalance listener

public class RebalanceListener implements ConsumerRebalanceListener{
    onPartitionAssigned(Collection<TopicPartition> partitions)
    onPartitionRevoked(Collection<TopicPartition> partitions)
}

execute java app

(maven repository)[https://repository.mapr.com/nexus/content/repositories/releases/]

<repositories>
  <repository>
    <id>mapr-maven</id>
    <url>http://repository.mapr.com/maven</url>
    <releases>
      <enabled>true</enabled>
    </releases>
    <snapshots>
      <enabled>false</enabled>
    </snapshots>
  </repository>
</repositories>
<dependencies>
  <dependency>
    <groupId>org.apache.kafka</groupId>
    <artifactId>kafka-clients</artifactId>
    <version>0.9.0.0-mapr-1602-streams-5.1.0</version>
    <scope>provided</scope>
  </dependency>
</dependencies>

execute on cluster

mapr classpath
java -cp `mapr classpath`:my-own-app.jar mypackage.MainClass

maprcli

login, print info, logout

maprlogin password -user {your cluster username}
maprlogin print
maprlogin logout

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

mapr.md

mapr.md

Architecture examples

MapR Streams

parallelism

sending messages via client library

spreading message between partitions, assigning message to paritiion

replication

reading messages via client library

reading messages cursor types

Replicating streams

command line

find CLDB hosts ( ContainerLocationDataBase )

create stream

create topic

API, java programming

producer

java example

sending conditions

parallel sending

retrieving metadata during connection with Kafka

consumer

java consumer

java rebalance listener

execute java app

maprcli

login, print info, logout

Files

mapr.md

Latest commit

History

mapr.md

File metadata and controls

Architecture examples

MapR Streams

parallelism

sending messages via client library

spreading message between partitions, assigning message to paritiion

replication

reading messages via client library

reading messages cursor types

Replicating streams

command line

find CLDB hosts ( ContainerLocationDataBase )

create stream

create topic

API, java programming

producer

java example

sending conditions

parallel sending

retrieving metadata during connection with Kafka

consumer

java consumer

java rebalance listener

execute java app

maprcli

login, print info, logout